SlideShare a Scribd company logo
1 of 41
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
1
DAI NAM UNIVERSITY
FACULTY OF FOREIGN LANGUAGES
GRADUATION INTERNSHIP REPORT
Location: DAI NAM UNIVERSITY
Student: Lam Thi Hoa Mi
Class: TAVB2 12-02
Student code: 1267010023
Supervisor: Pham Thi Bich Ngoc (M.A.)
HANOI – August, 2020
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
2
ACKNOWLEDGMENT
In the process of completing this graduation paper, I have received a great
deal of help, guidance and encouragement from my teachers and my colleagues.
Firstly, I feel very grateful to Ms. Pham Thi Bich Ngoc, my supervisor, who
helped me a lot during this internship. We have regularly exchanged emails with
each other to get the best job done. I would like to express my sincere thanks to
her, who has always been by my side and helped me during the reporting period.
Besides, I would also like to thank the teachers of the Faculty of Foreign
Languages for supporting the teaching in the past years, equipping me with the
foundation knowledge to complete the graduation lesson.
Finally, I would like to thank my family, friends, and colleagues for their
constant support and encouragement for me to complete this article
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
3
TABLE OF CONTENTS
1. INTRODUCTION....................................................................................................4
1.2. Expectations of the internship: .........................................................................4
1.3. Duration of the internship:................................................................................4
1.4. Field of the internship:......................................................................................4
1.5. Reason to choose the topic: ..............................................................................4
2. THEORY OF TRANSLATION ..............................................................................4
2.1.Definition of translation....................................................................................4
2.2.Translation methods..........................................................................................5
2.2.1. Word-for-word translation ....................................................................5
2.2.2. Literal translation ..................................................................................5
2.2.3. Faithful translation ................................................................................5
2.2.4. Semantic translation ..............................................................................5
2.2.5. Adaptation .............................................................................................6
2.2.6. Free translation......................................................................................6
2.2.7. Idiomatic translation..............................................................................6
2.2.8. Communicative translation ...................................................................7
2.2.9. Gist Translation.....................................................................................7
3. TRANSLATION PRACTICE .................................................................................8
3.1.Vietnamese - English Translation.....................................................................8
3.2.English - Vietnamese Translation...................................................................15
4. CONCLUSION......................................................................................................25
4.1.The achievements ...........................................................................................25
4.2.The existences.................................................................................................25
5. REFERENCES.......................................................................................................25
6. SUPERVISOR’S REMARKS ...............................................................................25
APPENDIX ...................................................................................................................27
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
4
INTERNSHIP REPORT
1. INTRODUCTION
1.1. Purposes of the internship
Graduation internship is a compulsory task of every university curriculum. It
is a valuable opportunity for students to get access to reality. With this
opportunity, I want to fulfill my goals and expectations.
While studying at the Foreign Language Department of Dai Nam University, I
had the opportunity to be exposed to a professional English environment, so I
have accumulated a lot of English knowledge and developed many skills. Of the
courses, translation is useful for my own specialization, which is Information
Technology. Thanks to this translation skill, the scientific articles that I do on
with my team have been translated as good as possible. Therefore, this
internship report is not only my mission but also a good opportunity for me to
review all of the translation knowledge that I have learned so far. In this
internship report, I focus only on the translation section and give some
translation methods in each sentence.
1.2. Expectations of the internship:
My expectations of the internship are: practice more in language skills;
improve writing and discussion skills; improve reading skills; create a
foundation for learning and scientific research on information ; and contribute to
the education cause of the locality as well as of Vietnam.
1.3. Duration of the internship:
From 20/07/2020 to 05/09/2020
1.4. Field of the internship:
Some translation techniques used in scientific articles.
1.5. Reason to choose the topic:
Applying the translation methods again in this internship report helps
me to apply the knowledge learned into practice; study and practice soft
skills as well as improve teaching expertise; improve research, writing and
document collection skills, etc.
2. THEORY OF TRANSLATION
2.1. Definition of translation
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
5
Translation, by dictionary definition, consists of changing from one form to
another, to turn into one’s own or another language. Some authors have given
the following different definitions of translation:
Translation is the replacement of textual material in one language (source
language) by equivalent textual material in another language (target language).
(JC Catford). Or,
Translation is rendering the meaning of a text into another language in the
way that the author intended the text. (Peter Newmark)
2.2. Translation methods
There are nine types of translation:
2.2.1. Word-for-word translation
This is often demonstrated as interlinear translation, with the target language
immediately below the source language words. The source language word-order
is preserved and the words translated singly by their most common out of
context.
2.2.2. Literal translation
The source language grammatical constructions are converted to their
nearest target language equivalents but the lexical words are again translated
singly, out of context. As a pretranslation process, this indicates the problems to
be solved.
For example:
He is a big liar  Anh ta là một kẻ nói dối lớn.
2.2.3. Faithful translation
A faithful translation attempts to reproduce the precise contextual meaning
of the original within the constraints of the target language grammatical
structures. It ‘transfers’ cultural words and preserves the degree of grammatical
and lexical ‘abnormality’ (deviation from source language norms) in the
translation.
For example:
He is as fast as a kangaroo  Gã nhanh như một con kanguru.
2.2.4. Semantic translation
Semantic translation differs ‘faithful translation’ only in as far as it must
take more account of the aesthetic value (that is, the beautiful and natural sound)
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
6
of the source language text, compromising on ‘meaning’ where appropriate so
that no assonance, word-play or repetition jars in the finished version. Further, it
may translate less important cultural words by culturally neutral third or
functional terms but not by cultural equivalents. The distinction between
‘faithful’ and ‘semantic’ translation is that the first is uncompromising and
dogmatic, while the second is more flexible, admits the creative exception to
100% fidelity, and allows for the translator’s intuitive empathy with the original.
For example:
Right in the heart of Hanoi, Hoan Kiem Lake is an enchanting body of
water, a peaceful oasis away from all the hustle and bustle of the city.
 Nằm ngay giữa trái tim Hà Nội, hồ Hoàn Kiếm là một hồ nước đẹp mê
hồn, một ốc đảo yên bình tách biệt với tất cả những gì ồn ào tấp nập của thành
phố.
2.2.5. Adaptation
This is the ‘freest’ form of translation. It is used mainly for plays (comedies)
and poetry: the themes, characters, plots are usually preserved, the source
language culture converted to the target language culture and the text rewritten
by an established dramatist or poet.
2.2.6. Free translation
Free translation reproduces the matter without the manner, or the content
without the form of the original. Usually, it is a paraphrase much longer than the
original, a so-called ‘intralingual translation’.
For example:
Heartease (pansy) is used again for healing the heart. It is for
disappointment in love, and in separation.
Hoa păng-xê cũng được dùng để chữa lành các vết thương lòng. Nó xoa
diụ sự thất vọng trong tình yêu, và cả nỗi đau phải sống trong cảnh li thân.
2.2.7. Idiomatic translation
Idiomatic translation reproduces the ‘message’ of the original but tends to
distort nuances of meaning by preferring colloquialisms and idioms where these
do not exist in the original.
For example:
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
7
Không ai nghe lời khuyên của cô ấy.
 Her advice fell on deaf ears.
2.2.8. Communicative translation
Communicative translation attempts to render the exact contextual meaning
of the original in such a way that both content and language are readily
acceptable and comprehensible to the readership.
For example:
Right in the heart of Hanoi, Hoan Kiem Lake is an enchanting body of
water, a peaceful oasis away from all the hustle and bustle of the city.
 Hồ Hoàn Kiếm là một hồ nước đẹp, yên tĩnh nằm ở trung tâm Hà Nội
ồn ào.
2.2.9. Gist Translation
It is the freest type of translation. Gist translation is characterized by keeping
the main idea/gist of a text, omitting all its supporting details and subsidiary
arguments. Gist translation can be used in language learning situations to
summarize a written text at a written test.
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
8
3. TRANSLATION PRACTICE
3.1. Vietnamese - English Translation
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
1. Khai thác luật kết hợp từ các tập mục hữu ích cao. Mining association rules from high utility itemsets Literal
2. Trong kinh doanh, các doanh nghiệp đều có chung
một mong muốn là làm thế nào để tăng doanh thu hay
lợi nhuận.
In business, businesses all have the same desire
which is how to increase revenue or profit.
Literal
3. Ví dụ, các siêu thị thường phân tích hoạt động kinh
doanh của mình để xem xét sản phẩm nào mang lại lợi
nhuận cao cho siêu thị.
For example, supermarkets often analyze their
business to find which products bring high profits to
them.
Faithful
4. Để thực hiện được việc này, cần khai thác tập hữu ích
cao.
To do this, it is necessary to exploit the high utility
itemsets.
Literal
5. Gần đây có nhiều công trình quan tâm đến lĩnh vực
này, nhưng các công trình trên tốn nhiều thời gian và
bộ nhớ sử dụng trong quá trình khai thác.
Recently, there are many studies interested in this
field, but the above works take a lot of time and
memory usage in the mining process.
Literal
6. Trong công trình này, nhóm tác giả đề xuất một thuật
toán giúp tiết kiệm được thời gian và bộ nhớ trong quá
trình khai thác.
In this work, the authors propose an algorithm to
reduce time and memory in the mining process.
Literal
7. Khai thác dữ liệu là một quá trình quan trọng trong
khám phá tri thức, nó là quá trình mô tả và dự đoán
dựa trên các thông tin, tri thức, dữ liệu đã được lưu
trữ, và phân tích các dữ liệu để tìm ra các dạng thức
hoặc kết hợp có tính lặp đi lặp lại và tạo thành qui luật,
các qui luật này hỗ trợ trong việc ra quyết định trong
các lĩnh vực như: khoa học, giáo dục, kinh doanh,
v.v...
Data mining is an important process in knowledge
discovery, it is the process of describing and
predicting based on stored information, knowledge,
data, and analyzing data to exploit. patterns or
combinations that are repetitive and form rules
which aid in decision making in areas such as
science, education, business, etc.
Faithful
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
9
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
8. Khai thác dữ liệu còn là quá trình phát hiện các mô
hình, các tổng kết khác nhau và các giá trị được lấy từ
tập dữ liệu cho trước.
Data mining is also the discovering different
models, summaries and values taken from a given
database.
Literal
9. Khai thác tập mục hữu ích cao là bài toán mở rộng và
tổng quát của khái thác tập phổ biến.
Exploiting high utility itemsets is an extensive and
general problem of frequent itemset mining.
Literal
10. Trong khai thác tập mục hữu ích cao, giá trị của item
trong giao dịch được quan tâm nhiều nhất (như số
lượng đã bán của mặt hàng), ngoài ra còn có bảng lợi
ích cho biết lợi ích mang lại khi bán một đơn vị hàng
đó.
In the mining HUIs, the value of the item is the most
interest in the transaction (such as the quantity sold
of the item), besides, there is also a profit table
indicating the profit of selling a product/item unit.
Faithful
11. Lợi ích của một itemset là số đo lợi nhuận của itemset
đó đóng góp trong cơ sở dữ liệu, nó có thể là tổng lợi
nhuận hay tổng chi phí của itemset.
The profit of an itemset is sum of its profit in
database, and it can be the total profit or the total
cost of the itemset.
Literal
12. Khai thác tập mục hữu ích cao là khám phá ra tất cả
các tập mục có lợi ích không nhỏ hơn ngưỡng phổ
biến tối thiểu do người dùng qui định.
Exploiting HUIs is to discover all of the itemsets
whose utilities are not less than the minimum utility
threshold specified-user.
Faithful
13. Mục đích chính của các bài toán khai thác tập mục
hữu ích cao là làm giảm thiểu kích thước của tập ứng
viên và làm đơn giản hóa quá trình tính toán độ hữu
ích các tập mục.
The main purpose of the problem of exploiting HUI
is to minimize the size of the candidate set and to
simplify their utilities computation.
Literal
14. Cách tiếp cận đơn giản nhất cho bài toán khai thác tập
mục hữu ích cao là liệt kê tất cả các tập mục từ cơ sở
dữ liệu giao dịch theo nguyên lý vét cạn.
The simplest approach to the HUI mining problem
is to list all the itemsets from the transaction
database according to the exhausting principle.
Literal
15. Do đó, làm thế nào để tỉa bớt không gian tìm kiếm và Therefore, how to prune the search space and Literal
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
10
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
tìm đủ tất cả tập mục hữu ích cao một cách hiệu quả là
một thách thức lớn trong khai thác tính hữu ích.
extract full of HUIs effectively is a major challenge
in utility mining.
16.
Bài toán khai thác luật kết hợp từ các mẫu hữu ích cao
còn khá mới. Sahoo và các đồng sự đã khởi đầu
nghiên cứu và đề xuất thuật toán khai thác luật kết hợp
hữu ích cao vào năm 2015.
The problem of exploiting association rules from
highly useful patterns is quite new. Sahoo and
colleagues started researching and proposing a
highly useful association law mining algorithm in
2015
Faithful
17. Phát biểu bài toán: Cho một cơ sở dữ liệu giao dịch D,
ngưỡng độ hữu ích tối thiểu minutil và ngưỡng độ tin
cậy hữu ích tối thiểu min-uconf, bài toán khai thác luật
kết hợp hữu ích cao từ cơ sở dữ liệu D là tìm tất cả các
luật có độ hữu ích lớn hơn hoặc bằng độ hữu ích tối
thiểu minutil và có độ tin cậy hữu ích lớn hơn hoặc
bằng độ tin cậy hữu ích tối thiểu.
Problem statement: For a transaction database D,
the minutil minimum useful threshold and the
minuconf minimum useful confidence threshold, the
problem of exploiting highly useful association
rules from the database D is to find all the rules
that have a minutil usefulness or greater than or
equal to a minimum usefulness.
Literal
18. Các thuật toán đề xuất được cài đặt và thực nghiệm
trên môi trường có cấu hình như sau: Intel Core I7-
7500U 2.5 GHz, Ram 16 GB, hệ điều hành Windows
10, phiên bản 64 bit.
The exported algorithms are installed and tested on
the environment with the following configuration:
Intel Core I7-7500U 2.5 GHz, 16 GB RAM,
Windows 10 operating system, 64 bits version.
export
19. Các cơ sở dữ liệu dùng cho thực nghiệm là các cơ sở
dữ liệu chuẩn được tải từ website mã nguồn mở SPMF
phát triển bởi Philippe.
The experimental databases were the standard ones
downloaded from the open source SPMF website
developed by Philippe.
Faithful
20. Thuật toán FHIM được đề xuất bởi Sahoo và các đồng
sự được dùng để khai thác các tập mục hữu ích cao từ
các cơ sở dữ liệu được đề cập ở trên.
The FHIM algorithm proposed by Sahoo et al. is
used to exploit HUIs from the databases mentioned
above.
Word-for-word
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
11
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
21. Kết quả luật kết hợp hữu ích cao với độ tin cậy hữu
ích tối thiểu 60% - 80% và các độ hữu ích tối thiểu
tương ứng của từng cơ sở dữ liệu được liệt kê.
Highly utility association rules with minimum
confidence from 60% to 80% and corresponding
minimum utility threshold of each database listed.
Faithful
22.
Thuật toán đề xuất LARM có thời gian thực thi tối ưu
nhờ vào cải tiến không gian tìm kiếm thông qua việc
áp dụng tính chất 1 đã đề cập ở trên
The proposed algorithm LARM has an optimal
execution time base on the improvement of the
search space through the application of property 1
mentioned above.
Faithful
23. Trong phần tiếp theo của thực nghiệm, các đồ thị so
sánh về thời gian thực thi sử dụng giữa hai thuật toán
LARM và HGB-HAR sẽ được trình bày dưới dạng đồ
thị sử dụng tỉ lệ thang logarit của 10.
In the next part of the experiment, graphs of the
execution time between the LARM and HGB-HAR
will be presented with the logarithmic scale of 10.
Free
24. Trong nghiên cứu này, tác giả sử dụng mô hình độ tin
cậy hữu ích và lý thuyết dàn để khai thác luật kết hợp
hữu ích cao nhằm khai thác mối quan hệ giữa các tập
mục hữu ích cao.
In this study, the author uses the utility model and
lattice theory to exploit the high utility association
rule to find the relationship between the high utility
itemsets
Literal
25.
Nghiên cứu này là nghiên cứu đầu tiên áp dụng lý
thuyết về dàn trong khai thác luật kết hợp hữu ích cao.
This is the first study which apply the lattice
concept theory in highly utility association rule
mining
Faithful
26. Tác giả đã đề xuất thuật toán HUIL để xây dựng dàn
gồm các tập mục hữu ích cao.
The author proposed an algorithm HUIL to build a
concept of lattice of HUIs.
Faithful
27.
Kết quả thực nghiệm trên một số cơ sở dữ liệu chuẩn
cho thấy thuật toán đã đề xuất, LARM, có hiệu quả
cao cả về thời gian thực thi và bộ nhớ sử dụng.
Experimental results on standard databases show
that the proposed algorithm, LARM, has better
efficiency in both execution time and memory
usage.
Literal
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
12
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
28.
Tính hiệu quả của thuật toán sẽ đóng góp rất lớn trong
các hệ thống dự báo và ra quyết định.
The efficiency of the algorithm will make a huge
contribution to prediction and decision-making
systems.
Literal
29. Nghiên cứu này có thể được ứng dụng hiệu quả trong
sản xuất kinh doanh, lập kế hoạch kinh doanh cũng
như cuộc sống dựa vào đặc điểm và tính chất ứng
dụng luật ứng với mỗi luật trong tập luật.
This research can be applied in production and
business, business planning as well as life
effectively base on each rule’s characteristics and
property
Literal
30. Kết quả từ các luật kết hợp hữu ích cao sẽ mang lại kết
quả hữu ích cho lãnh đạo trong khi hoạch định kế
hoạch sản xuất, kinh doanh trong thời gian sắp tới,
điển hình như xem xét các tập mặt hàng kết hợp với
nhau mang lại lợi nhuận cao trong hoạt động kinh
doanh bán lẻ, hoặc để xuất các chương trình khuyến
mãi nhằm mang lại hiệu quả kinh doanh cao nhất.
High utility association rules will bring leaders
helpful results in planning for production and
business in the near future, typically as considering
the combination of products to bring high profits in
retail business or launching promotions to bring the
best business performance.
Faithful
31. Bộ Y tế xác định tập trung nguồn lực truy vết để phát
hiện sớm người bệnh, hạn chế sự lây lan của virus
SARS-CoV-2, đồng thời điều trị sớm, hạn chế những
biến chứng do các bệnh lý nền hoặc do COVID-19, đó
là hai mũi giáp công cần được thực hiện để hạn chế
thấp nhất những tác động mà dịch gây ra.
The Ministry of Health determined to focus all
traceability resources to early detect patients, limit
the spread of the SARS-CoV-2 virus and at the same
time provide early treatment, limit complications
caused by underlying diseases or issued by COVID-
19. These are two attacks that need to be done to
minimize the effects the epidemic causes.
Literal
32. Theo nhận định của Bộ Y tế, mặc dù chúng ta đang
kiểm soát được tình hình dịch bệnh COVID-19 tại Đà
Nẵng, Quảng Nam và một số địa phương khác, tuy
nhiên tình hình dịch sẽ tiếp tục kéo dài và xuất hiện
các chùm ca bệnh và ca bệnh tại cộng đồng.
Although, according to the Ministry of Health, we
are controlling the COVID-19 epidemic in Da
Nang, Quang Nam, and some other localities, the
epidemic situation will continue to prolong and
there wil be many more cases in the community.
Faithful
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
13
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
33. Tại buổi giao ban trực tuyến về công tác phòng, chống
dịch với lãnh đạo sở y tế các địa phương chiều 19/8,
Quyền Bộ trưởng Y tế Nguyễn Thanh Long cho biết ổ
dịch ở Quảng Nam, Quảng Ngãi và Đà Nẵng đang
từng bước được kiểm soát.
At the online on epidemic prevention and control
with leaders of local health departments on August
19, Acting Health Minister Nguyen Thanh Long
said that outbreaks in Quang Nam, Quang Ngai and
Da Nang were being step by step controlled.
Word-for-word
34.
Số ca mắc giảm dần trong những ngày gần đây.
The number of cases has been decreasing in recent
days.
Word-for-word
35. Từ bài học của Đà Nẵng, Quảng Nam và Hải Dương,
Quyền Bộ trưởng cho rằng vấn đề đặt ra là các địa
phương phải làm gì khi dịch bệnh xảy ra.
Learning from Da Nang, Quang Nam and Hai
Duong, the Acting Minister said that the problem is
what localities must do when the epidemic occurs.
Free
36.
Thực tế, nhiều địa phương còn lúng túng trong cách
xử lý.
In fact, many localities are still confused in how to
handle the epidemic.
Free
37. Đó là lý do Bộ Y tế phải thường xuyên điều chuyên
gia trung ương hỗ trợ các địa phương.
That is the reason why the Ministry of Health has to
regularly send central experts to assist localities.
Literal
38. Ông Nguyễn Thanh Long cho hay chúng ta đang tìm
mọi phương pháp để tiếp cận vaccine ngừa COVID-
19.
Mr. Nguyen Thanh Long said we are looking for all
methods to approach the COVID-19 vaccine.
Word-for-word
39.
Thời gian dự kiến sớm nhất là 6 tháng cuối năm 2021
vaccine có thể đến với người dân.
The earliest expected time is the last 6 months of
2021, the vaccine against covid-19 can be
distributed to the people.
Faithful
40.
Người dân cần sẵn sàng chiến đấu với dịch.
People need to be ready mentally to fight the
epidemic.
Word-for-word
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
14
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
41. Các địa phương phải chuẩn bị cho tâm thế dịch sẽ kéo
dài, nếu không có vaccine, cuộc chiến chống dịch rất
khó khăn.
The localities must prepare for the epidemic that
will last long. Without vaccines, the fight against
the epidemic will face many difficulties.
Faithful
42. Quyền Bộ trưởng Nguyễn Thanh Long cũng đề nghị
các địa phương chủ động chống dịch theo phương
châm 4 tại chỗ.
Acting Minister Nguyen Thanh Long also suggested
that localities should actively fight against the
epidemic under the motto 4 in place.
Word-for-word
43.
Ngoài ra, các địa phương cần chủ động mua sắm trang
thiết bị, sinh phẩm và thực hiện sàng lọc theo đúng
quy định để được bảo hiểm y tế thanh toán.
In addition, localities need to actively purchase
equipment and biological products, and perform
screening in accordance with regulations to be paid
by health insurance.
Faithful
44.
Tuy nhiên, việc sàng lọc trong cộng đồng sẽ không
được thanh toán.
However, community screening will not be covered
by insurance.
Literal
45.
Về vấn đề trang thiết bị phòng hộ cho chống dịch, các
tỉnh, thành phải đảm bảo giường cấp cứu và nhân lực.
On the issue of protective equipment for anti-
epidemic diseases, provinces must ensure adequate
emergency beds and human resources.
Free
46. Theo Quyền Bộ trưởng Y tế, đến nay, cả nước có
khoảng 150 ổ dịch.
According to the Acting Minister of Health, up to
now, Vietnam has about 150 outbreaks.
Word-for-word
47. Ngành y tế đã có nhiều bài học trong phòng, chống
dịch như chần chừ sẽ rất nguy hiểm, phải truy tìm,
cách ly nhanh để đưa mầm bệnh ra khỏi cư dân, cộng
đồng.
The health sector has had many lessons in epidemic
prevention and control such as delaying it will be
very dangerous, quickly tracing and quarantining to
bring pathogens out of residential areas.
Faithful
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
15
STT Bản gốc Bản dịch
Phương pháp/ Kỹ
thuật
48. Nhận định công tác giám sát rất quan trọng, lãnh đạo
Bộ Y tế đã yêu cầu các nhà thuốc phải giám sát chặt
các trường hợp mua thuốc nghi ngờ như ốm, ho, sốt,...
nếu không báo cho cơ sở y tế thì yêu cầu xử lý
nghiêm.
Recognizing that surveillance is very important, the
Ministry of Health has asked pharmacies to closely
monitor all drug purchases with symptoms such as
illness, cough, and fever. If they do not notify the
medical facility, they will be strictly punished.
Literal
49. Đối với các bệnh viện, nếu để tình trạng bệnh nhân
nghi ngờ “lọt” thì cũng sẽ bị xử lý nghiêm.
For hospitals, if the patient's condition is suspected
of "passing", they will also be strictly dealt with.
Free
50. Trong đợt dịch bùng phát mới đây, Đà Nẵng có số ca
nhiễm SARS-CoV-2 cao nhất cả nước, tiếp theo là
Quảng Nam.
During the recent outbreak, Da Nang had the
highest number of SARS-CoV-2 infections in the
country, followed by Quang Nam.
Faithful
3.2. English - Vietnamese Translation
No. Original Translation
Translation Methods
/ Techniques
51. Frequent itemset mining (FIM) [1], [3], [8], [9],
[18], [19], [20], [28], [29] is a fundamental
research topic in data mining.
Khai thác tập phổ biến (FIM) [1], [3], [8],
[9], [18], [19], [20], [28], [29] là một chủ đề
nghiên cứu cơ bản trong khai phá dữ liệu.
Literal
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
16
No. Original Translation
Translation Methods
/ Techniques
52. However, the traditional FIM may discover a
large amount of frequent but low-value itemsets
and lose the information on valuable itemsets
having low selling frequencies.
Tuy nhiên, FIM truyền thống có thể phát hiện
ra một lượng lớn các tập phổ biến nhưng có
giá trị thấp và mất thông tin về các tập mà có
tần số bán hàng thấp.
Faithful
53.
Hence, it cannot satisfy the requirement of
users who desire to discover itemsets with high
utilities such as high profits.
Do đó, thuật toán này không thể đáp ứng
được yêu cầu của người dùng đó là mong
muốn khám phá những tập sản phẩm có lợi
nhuận cao.
Faithful
54.
To address these issues, utility mining [2], [4],
[7], [10], [11], [12], [13], [14], [15], [16], [17],
[18], [22], [23], [25], [26], [27], [29], [34], [35],
[36] emerges as an important topic in data
mining and has received extensive attention in
recent years.
Để giải quyết những vấn đề này, khai thác độ
hữu ích [2], [4], [7], [10], [11], [12], [13],
[14], [15], [16], [17] , [18], [22], [23], [25],
[26], [27], [29], [34], [35], [36] nổi lên như
một chủ đề quan trọng trong khai thác dữ liệu
và trong những năm gần đây, chủ đề này đã
nhận được sự quan tâm rộng rãi.
Literal
55.
In utility mining, each item is associated with a
utility (e.g. unit profit) and an occurrence count
in each transaction (e.g. quantity).
Trong khai thác độ hữu ích, mỗi mục được
liên kết với một độ hữu ích (ví dụ: lợi nhuận
của một đơn vị sản phẩm) và số lần xuất hiện
trong mỗi giao dịch (ví dụ: số lượng bán
hàng).
Literal
56. The utility of an itemset represents its
importance, which can be measured in terms of
weight, value, quantity or other information
depending on the user specification
Độ hữu ích của một tập mục thể hiện tầm
quan trọng của nó, có thể được đo lường về
trọng lượng, giá trị, số lượng hoặc các thông
tin khác tùy thuộc vào sự lựa chọn của người
Literal
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
17
No. Original Translation
Translation Methods
/ Techniques
dùng
57.
An itemset is called high utility itemset (HUI) if
its utility is no less than a user-specified
minimum utility threshold min_util.
Một tập được gọi là tập hữu ích cao (HUI)
nếu độ hữu ích của nó không nhỏ hơn ngưỡng
hữu ích tối thiểu do người dùng chỉ định
min_util.
Literal
58. HUI mining is essential to many applications
such as streaming analysis [2], [11], [35],
market analysis [13], [17], [22], mobile
computing [23] and biomedicine [4].
Khai thác HUI rất cần thiết cho nhiều ứng
dụng như phân tích luồng dữ liệu [2], [11],
[35], phân tích thị trường [13], [17], [22],
điện toán di động [23] và y sinh học [4].
Literal
59.
However, efficiently mining HUIs in databases
is not an easy task because the downward
closure property [1], [8] used in FIM does not
hold for the utility of itemsets
Tuy nhiên, việc khai thác HUI hiệu quả
không phải là một nhiệm vụ dễ dàng vì thuộc
tính bao đóng giảm [1], [8] sử dụng trong
FIM không áp dụng được trong độ hữu ích
của tập mục.
Faithful
60.
In other words, pruning search space for HUI
mining is difficult because a superset of a low
utility itemset can be high utility.
Nói cách khác, việc cắt tỉa không gian tìm
kiếm trong khai thác HUI là rất khó bởi vì
một tập cha của một tập có độ hữu ích thấp
có thể là một tập hữu ích.
Literal
61. To tackle this problem, the concept of
transaction weighted utilization (TWU) model
[13] was introduced to facilitate the
performance of the mining task.
Để giải quyết vấn đề này, khái niệm về mô
hình sử dụng trọng số giao dịch (TWU) [13]
đã được đưa ra để nâng cao nhiệm vụ khai
thác dữ liệu.
Free
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
18
No. Original Translation
Translation Methods
/ Techniques
62. In this model, an itemset is called high
transaction-weighted utilization itemset
(HTWUI) if its TWU is no less than min_util,
where the TWU of an itemset represents an
upper bound on its utility.
Trong mô hình này, một tập được gọi là tập
có trọng số giao dịch cao (HTWUI) nếu TWU
của nó không nhỏ hơn min_util, trong đó
TWU của một tập là cận trên về độ hữu ích
của nó.
Faithful
63. Therefore, a HUI must be a HTWUI and all the
HUIs must be included in the complete set of
HTWUIs.
Do đó, HUI phải là HTWUI và tất cả các
HUI phải được bao gồm trong bộ HTWUI
hoàn chỉnh
Word-for-word
64. A classical TWU model-based algorithm
consists of two phases.
Một thuật toán dựa trên mô hình TWU cổ
điển bao gồm hai giai đoạn.
Faithful
65. In the first phase, called phase I, the complete
set of HTWUIs are found.
Trong giai đoạn đầu, được gọi là giai đoạn I,
sẽ xác định đây đủ tập HTWUIs.
Literal
66.
In the second phase, called phase II, all HUIs
are obtained by calculating the exact utilities of
HTWUIs with one database scan.
Trong giai đoạn thứ hai,, tất cả các HUI
được xác định bằng cách tính chính xác độ
hữu ích của HTWUI với một lần quét cơ sở
dữ liệu.
Free
67. Although many studies have been devoted to
HUI mining, it is difficult for users to choose an
appropriate minimum utility threshold in
practice.
Mặc dù nhiều nghiên cứu về khai thác HUI,
trong thực tế, người dùng rất khó để chọn
một ngưỡng độ hữu ích thiểu thích hợp.
Faithful
68. Depending on the threshold, the output size can
be very small or very large.
Tùy thuộc vào ngưỡng, kích thước kết quả có
thể rất nhỏ hoặc rất lớn.
Free
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
19
No. Original Translation
Translation Methods
/ Techniques
69.
Besides, the choice of the threshold greatly
influences the performance of the algorithms.
Bên cạnh đó, việc lựa chọn ngưỡng ảnh
hưởng lớn đến hiệu suất thực thi của các
thuật toán.
Literal
70. If the threshold is set too low, too many HUIs
will be presented to the users and it is difficult
for the users to comprehend the results.
Nếu ngưỡng được chọn quá thấp, quá nhiều
HUIs sẽ được phát hiện do đó cho người
dùng khó mà hiểu được kết quả thu được.
Faithful
71. A large number of HUIs also causes the mining
algorithms to become inefficient or even run
out of memory, because the more HUIs the
algorithms generate, the more resources they
consume.
Số lượng HUI lớn cũng làm cho thuật toán
khai thác trở nên kém hiệu quả hoặc thậm chí
hết bộ nhớ, vì các thuật toán tạo ra càng
nhiều HUI thì chúng càng tiêu tốn tài nguyên
càng nhiều.
Faithful
72. On the contrary, if the threshold is set too high,
no HUI will be found.
Ngược lại, nếu ngưỡng được chọn quá cao,
sẽ không có HUI nào được tìm thấy.
Word-for-word
73. To find an appropriate value for the min_util
threshold, users need to try different thresholds
by guessing and re-executing the algorithms
over and over until being satisfied with the
results.
Để tìm một giá trị thích hợp cho ngưỡng
min_util, người dùng cần thử các ngưỡng
khác nhau bằng cách đoán và thực hiện lại
nhiều lần các thuật toán cho đến khi hài lòng
với kết quả.
Literal
74. This process is both inconvenient and time-
consuming.
Quá trình này vừa bất tiện vừa tốn thời gian Free
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
20
No. Original Translation
Translation Methods
/ Techniques
75. To precisely control the output size and
discover the itemsets with the highest utilities
without setting the thresholds, a promising
solution is to redefine the task of mining HUIs
as mining top-k high utility itemsets (top-k
HUIs).
Để kiểm soát chính xác kích thước đầu ra và
khám phá các tập có độ hữu ích cao nhất mà
không cần đặt ngưỡng, một giải pháp tiềm
năng là xác định lại nhiệm vụ khai thác HUI
như khai thác k tập có độ hữu ích lớn nhất
thỏa ngưỡng
Free
76. The idea is to let the users specify k, i.e., the
number of desired itemsets, instead of
specifying the minimum utility threshold.
Ý tưởng là để cho người dùng chọn số k, tức
là số lượng tập mục mong muốn, thay vì chỉ
định ngưỡng độ hữu ích tối thiểu.
Word-for-word
77. Setting k is more intuitive than setting the
threshold because k represents the number of
itemsets that the users want to find whereas
choosing the threshold depends primarily on
database characteristics, which are often
unknown to users.
Chọn k sẽ trực quan hơn chọn ngưỡng vì k là
số lượng tập mà người dùng muốn tìm trong
khi việc chọn ngưỡng phụ thuộc chủ yếu vào
các đặc tính của cơ sở dữ liệu mà người dùng
thường không biết.
Literal
78. Using a parameter k instead of the min_util
threshold is very desirable for many
applications.
Sử dụng tham số k thay cho ngưỡng min_util
là nhu cầu đối với nhiều ứng dụng.
Free
79. For example, to analyze customer purchase
behavior, top-k HUI mining serves as a
promising solution for users who desire to
know:
Ví dụ: để phân tích hành vi mua hàng của
khách hàng, khai thác top-k HUI như một
giải pháp đầy tiềm năng cho những người
dùng muốn biết:
Literal
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
21
No. Original Translation
Translation Methods
/ Techniques
80. “What are the top-k sets of products (i.e.,
itemsets) that contribute the highest profits to
the company?” and “How to efficiently find
these itemsets without setting the min_util
threshold?”
"K sản phẩm nào mang lại lợi nhuận cao
nhất cho công ty?" và “Làm thế nào để xác
định những bộ sản phẩm này mà không cần
chọn ngưỡng min_util? ”.
Free
81. Although top-k HUI mining is essential to
many applications, developing efficient
algorithms for mining such patterns is not an
easy task.
Mặc dù khai thác top-k HUI là điều cần thiết
đối với nhiều ứng dụng, nhưng việc phát triển
các thuật toán hiệu quả để khai thác các mẫu
như vậy không phải là một nhiệm vụ dễ dàng.
Faithful
82. It poses four major challenges as discussed
below.
Nó đặt ra bốn thách thức lớn sẽ được thảo
luận dưới đây.
Faithful
83. First, the utility of itemsets is neither monotone
nor antimonotone [1], [8]
Đầu tiên, độ hữu ích của các tập không đơn
điệu cũng không phải là đơn nguyên[1], [8]
Faithful
84. In other words, the utility of an itemset may be
equal to, higher or lower than that of its
supersets and subsets
Nói cách khác, độ hữu ích của một tập có thể
bằng, cao hơn hoặc thấp hơn độ hữu ích của
tập con và tập cha của nó.
Literal
85. Therefore, many techniques developed in top-k
frequent pattern mining that rely on anti-
monotonicity to prune the search space cannot
be directly applied to top-k high utility itemset
mining.
Do đó, nhiều kỹ thuật được phát triển trong
khai thác top-k mẫu phổ biến dựa trên tính
đơn điệu để tỉa bớt không gian tìm kiếm
không thể được áp dụng trực tiếp cho khai
thác top-k tập hữu ích cao.
Literal
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
22
No. Original Translation
Translation Methods
/ Techniques
86. The second challenge is how to incorporate the
concept of top-k pattern mining with the TWU
model
Thách thức thứ hai là làm thế nào để kết hợp
khái niệm khai thác mô hình top-k với mô
hình TWU.
Literal
87.
Although the TWU model is widely used in
utility mining, it is difficult to adapt this model
to top-k HUI mining because the exact utilities
of itemsets are unknown in phase I.
Mặc dù mô hình TWU được sử dụng rộng rãi
trong khai thác độ hữu ích, nhưng rất khó để
điều chỉnh mô hình này sang khai thác top-k
HUI vì độ hữu ích chính xác của các tập
không được xác định trong giai đoạn I.
Literal
88. When a HTWUI is generated in phase I, we
cannot guarantee that its utility is higher than
other HTWUIs and that it is a top-k HUI before
performing phase II.
Khi HTWUI được phát sinh giai đoạn I,
chúng tôi không thể bảo đảm rằng độ hữu ích
của nó cao hơn các HTWUI khác và đó là
một top-k HUI trước khi thực thi giai đoạn II.
Word-for-word
89. To guarantee that all the top-k HUIs can be
captured in the set of HTWUIs, a naive
approach is to run the algorithm with min_util =
0.
Để đảm bảo rằng tất cả các top-k HUI được
lưu trong HTWUI, một cách tiếp cận đơn
giản là chạy thuật toán với min_util = 0.
Literal
90. However, this approach may face the problem
of a very large search space
Tuy nhiên, cách tiếp cận này có thể gặp phải
vấn đề về không gian tìm kiếm rất lớn.
Literal
91. The third challenge is that the min_util
threshold is not given in advance in top-k HUI
mining.
Thách thức thứ ba là ngưỡng min_util không
được xác định trước trong khai thác top-k
HUI.
Literal
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
23
No. Original Translation
Translation Methods
/ Techniques
92. In traditional HUI mining, the search space can
be efficiently pruned by the algorithms by using
a given min_util threshold.
Trong khai thác HUI truyền thống, các thuật
toán sẽ cắt tỉa không gian tìm kiếm dựa vào
ngưỡng min_util cho trước.
Faithful
93.
However, in the scenario of top-k HUI mining,
no min_util threshold is provided in advance.
Tuy nhiên, trong trường hợp khai thác top-k
HUI, không có lợi thế ngưỡng min_util cho
trước.
Faithful
94. Therefore, the minimum utility threshold is
initially set to 0 and the designed algorithm has
to gradually raise the threshold to prune the
search space.
Do đó, ngưỡng tiện ích tối thiểu ban đầu
được xác định là 0 và thuật toán được thiết kế
phải nâng dần ngưỡng để cắt tỉa không gian
tìm kiếm.
Literal
95. Such a threshold is an internal parameter of the
designed algorithm and is called the border
minimum utility threshold min_utilBorder in
this paper
Giống như ngưỡng là một tham số bên trong
của thuật toán được thiết kế và được gọi là
ngưỡng hữu ích tối biên thiểu và trong bài
báo sẽ ký hiệu là min_utilBorder.
Free
96. It is different from the external parameter
min_util that is given by users in advance
Nó khác với tham số min_util do người dùng
cung cấp trước.
Faithful
97. If an algorithm cannot raise the min_utilBorder
threshold effectively and efficiently, it would
produce too many intermediate low utility
itemsets during the mining process, which may
degrade its performance in terms of execution
time and memory usage.
Nếu một thuật toán không thể tăng ngưỡng
min_utilBorder một cách hiệu quả, thuật toán
sẽ tạo ra nhiều tập có độ hữu ích thấp trung
gian làm cho hiệu suất của thuật toán kém cả
về thời gian và bộ nhớ sử dụng.
Faithful
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
24
No. Original Translation
Translation Methods
/ Techniques
98. Thus the challenge is to design effective
strategies that can raise the min_util threshold
as high as possible and as quickly as possible,
and further reduce as much as possible the
number of candidates and intermediate low
utility itemsets produced in the mining process.
Do đó, thách thức là thiết kế các chiến lược
hiệu quả có thể nâng ngưỡng min_util lên cao
nhất và nhanh nhất có thể, đồng thời thu gọn
số lượng ứng viên và việc sinh ra các tập hữu
ích thấp trong quá trình khai thác càng nhiều
càng tốt.
Literal
99. The last challenge is how to effectively raise
the min_utilBorder threshold without missing
any top-k HUIs
Thách thức cuối cùng là làm thế nào để tăng
ngưỡng min_utilBorder một cách hiệu quả
mà không mất bất kỳ top-k HUI nào.
Literal
100. A good algorithm is one that can effectively
raise the threshold during the mining process.
Một thuật toán tốt là thuật toán có thể tăng
cao ngưỡng hiệu quả khi khai thác.
Faithful
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
25
4. CONCLUSION
4.1. The achievements
I learned a lot from this internship report. Translation is not simple and easy.
During this internship I had the opportunity to practice translation methods,
using a number of translation methods to complete this report such as word for
word, literal translation, faithful translation, communicative translation, and free
translation.
Thanks to this precious opportunity, I have had the opportunity to review a
wide range of skills and knowledge serving my work, such as translation theory
and writing skills.
4.2. The existences
In addition to the things achieved, I also find myself lacking a number of
shortcomings in the process of studying 2nd degree at Dai Nam University. First,
there is no English communication environment, so I only develop two skills for
myself: reading and writing. Second, I am constrained in documents specialized
in information technology, so there are more or fewer shortcomings in other
translation skills such as: semantic translation, idiomatic translation, adaptation
translation, and gist translation.
5. REFERENCES
[1] Ngọc Hướng, Tuấn Anh, Thu Hường, “Theory of Translation”, Khoa Ngoại
ngữ, Đại học Đại Nam.
[2] Nguyễn, T. T. L. (2018). Khai thác luật kết hợp từ các tập mục hữu ích cao.
[3] Đỗ Thoa. (2020, ngày 21 tháng 8). Chủ động ứng phó với tình trạng dịch
bệnh kéo dài. Truy xuất từ:
http://dangcongsan.vn/khoa-giao/chu-dong-ung-pho-voi-tinh-trang-dich-benh-
keo-dai-562004.html
[4] Tseng, V. S., Wu, C. W., Fournier-Viger, P., & Philip, S. Y. (2015).
Efficient algorithms for mining top-k high utility itemsets. IEEE Transactions
on Knowledge and data engineering, 28(1), 54-67.
6. SUPERVISOR’S REMARKS
.................................................................................................................................
.................................................................................................................................
.................................................................................................................................
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149
26
.................................................................................................................................
.................................................................................................................................
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
APPENDIX
[2]
(1)
Khai thác luật kết hợp từ các tập mục hữu ích cao
Nguyễn Thị Thuý Loan1
, Mai Hoàng Thắng2
1
Đại học Nguyễn Tất Thành
2
Công Ty TNHH Harvey Nash Việt Nam
nthithuyloan@gmail.com; mhthang.it@gmail.com
Tóm tắt
(2)
Trong kinh doanh, các doanh nghiệp đều có chung một mong muốn là làm thế nào để tăng doanh thu hay lợi
nhuận. (3)
Ví dụ, các siêu thị thường phân tích hoạt động kinh doanh của mình để xem xét sản phẩm nào mang lại
lợi nhuận cao cho siêu thị. (4)
Để thực hiện được việc này, cần khai thác tập hữu ích cao. (5)
Gần đây có nhiều
công trình quan tâm đến lĩnh vực này, nhưng các công trình trên tốn nhiều thời gian và bộ nhớ sử dụng trong quá
trình khai thác. (6)
Trong công trình này, nhóm tác giả đề xuất một thuật toán giúp tiết kiệm được thời gian và bộ
nhớ trong quá trình khai thác.
® 2018 Journal of Science and Technology - NTTU
Từ khóa: Khai thác dữ liệu, tập hữu ích cao, luật kết hợp.
1. Giới thiệu
(7)
Khai thác dữ liệu (KTDL) là một quá trình quan trọng trong khám phá tri thức, nó là
quá trình mô tả và dự đoán dựa trên các thông tin, tri thức, dữ liệu đã được lưu trữ, và
phân tích các dữ liệu để tìm ra các dạng thức hoặc kết hợp có tính lặp đi lặp lại và tạo
thành qui luật, các qui luật này hỗ trợ trong việc ra quyết định trong các lĩnh vực như:
khoa học, giáo dục, kinh doanh, v.v... (8)
KTDL còn là quá trình phát hiện các mô hình,
các tổng kết khác nhau và các giá trị được lấy từ tập dữ liệu cho trước [1].
Phương pháp KTDL thường được chia thành hai nhóm chính như sau:
(i) Kỹ thuật KTDL mô tả: có nhiệm vụ mô tả về các tính chất hoặc các đặc tính chung
của dữ liệu string hiện có. Các kỹ thuật này bao gồm: Phân cụm (Clustering), tóm tắt
(Summerization), trực quan hóa (Visualization), phân tích sự phát triển và độ lệch
(Evolution and Deviation analyst), khai phá luật kết hợp (Association rules), …
(ii) Kỹ thuật KTDL dự đoán: Có nhiệm vụ đưa ra các dự đoán dựa vào các suy diễn
trên dữ liệu hiện thời. Các kỹ thuật này gồm có: Phân lớp (Classifacation), hồi quy
(regession),
…. Tuy nhiên, chỉ có một số phương pháp thông dụng nhất là: Phân cụm dữ liệu, phân
lớp dữ liệu, phương pháp hồi quy, và khai phá luật kết hợp.
(9)
Khai thác tập mục hữu ích cao là bài toán mở rộng và tổng quát của khái thác tập
phổ biến. (10)
Trong khai thác tập mục hữu ích cao, giá trị của item trong giao dịch
được quan tâm nhiều nhất (như số lượng đã bán của mặt hàng), ngoài ra còn có bảng
lợi ích cho biết lợi ích mang lại khi bán một đơn vị hàng đó. (11)
Lợi ích của một
itemset là số đo lợi nhuận của itemset đó đóng góp trong CSDL, nó có thể là tổng lợi
nhuận hay tổng chi phí của itemset. (12)
Khai thác tập mục hữu ích cao là khám phá ra
tất cả các tập mục có lợi ích không nhỏ hơn ngưỡng phổ biến tối thiểu do người dùng
qui định. (13)
Mục đích chính của các bài toán khai thác tập mục hữu ích cao là làm
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
giảm thiểu kích thước của tập ứng viên và làm đơn giản hóa quá trình tính toán độ hữu
ích các tập mục từ đó giảm số lượng ứng viên cho tập mục hữu ích cao, giảm thời gian
khai thác.
(14)
Cách tiếp cận đơn giản nhất cho bài toán khai thác tập mục hữu ích cao là liệt kê tất
cả các tập mục từ CSDL giao dịch theo nguyên lý vét cạn, cách tiếp cận này sẽ gặp
phải vấn đề về thời gian, không gian khi tìm kiếm quá lớn và nhất là khi CSDL chứa
nhiều giao dịch hoặc ngưỡng min-util đặt ra quá thấp. (15)
Do đó, làm thế nào để tỉa bớt
không gian tìm kiếm và tìm đủ tất cả tập mục hữu ích cao một cách hiệu quả là một
thách thức lớn trong khai thác tính hữu ích.
Phần còn lại của bài báo được tổ chức như sau: Phần 2 trình bày các nghiên cứu liên
quan đến bài toán khai thác tập mục hữu ích cao, và khai thác luật kết hợp. Phần 3
trình bày thuật toán đóng góp bao gồm các định nghĩa liên quan và thuật toán đề xuất.
Kết quả thực nghiệm được trình bày trong phần 4. Kết luận và hướng phát triển được
trình bày trong phần 5.
2. Các công trình liên quan
Khai thác luật kết hợp truyền thống [2] chủ yếu dựa vào mô hình độ tin cậy – độ hỗ
trợ. Theo đó, tất cả item trong cơ sở dữ liệu (CSDL) được xem xét như nhau. Tuy
nhiên, trong CSDL thực tế, mỗi item có trọng số riêng của nó. Do đó, có nhiều nghiên
cứu liên quan đến mối quan hệ giữa trọng số của từng item với số lượng của nó. Khai
thác tập mục hữu ích cao là một trong những chủ đề liên quan đến vấn đề này. Bài
toán khai thác tập mục hữu ích cao giúp giải quyết vấn đề mà bài toán khai thác tập
phổ biến không giải quyết được. Trong khai thác tập hữu ích cao (HUIM), các item có
thể xuất hiện nhiều lần trong một giao dịch, mỗi item có một trong số (lợi nhuận, độ
hữu ích…). Kết quả của khai thác tập mục hữu ích cao được ứng dụng để tìm ra
itemsets trong cơ sở dữ liệu mang lại lợi nhuận cao.
Có rất nhiều thuật toán liên quan đã được đề xuất. Điển hình, Liu và các đồng sự
(2005) đề xuất thuật toán Two-Phase với các khái niệm về độ hữu ích của giao dịch –
Transaction Utility (TU) và trọng số hữu ích của giao dịch – Transaction Weighted
Utility (TWU) để cải tiến không gian tìm kiếm khai thác tập hữu ích cao [3]. Bởi vì
TWU của tập mục hữu ích thỏa mãn tính bao đóng giảm, do đó hoàn toàn có thể dựa
vào TWU và sửa đổi các thuật toán khai thác tập phổ biến để khai thác tập hữu ích
cao. Vì vậy, tác giả đã sửa đổi thuật toán Apriori để khai thác tập hữu ích cao. Thuật
toán Two-Phase bao gồm hai giai đoạn chính như sau.
Giai đoạn 1: Tìm tất cả tập item có giá trị lợi ích lớn hơn giá trị ngưỡng do người dùng
định nghĩa dựa trên trọng số hữu ích của giao dịch. Trong giai đoạn 1 chỉ có những kết
hợp của những tập mục có trọng số giao dịch có độ hữu ích cao mới được thêm vào
tập ứng viên trong suốt quá trình tìm kiếm thông minh trên mỗi mức. Tuy các tập item
có độ lợi ích thấp có thể được đánh giá cao nhưng thuật toán lại không đánh giá thấp
bất kỳ tập item nào.
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Giai đoạn 2: Duyệt cơ sở dữ liệu để lọc ra các tập itemset có lợi ích cao từ tập lợi
ích cao được tìm thấy trong giai đoạn 1. So với các thuật toán khai thác tập hữu ích
cao hiện nay, thuật toán Two-Phase gặp vấn đề là một số lượng rất lớn các tập ứng
viên được tạo ra nhưng hầu hết các ứng viên được sinh ra là có độ hữu ích không
cao sau khi các giá trị hữu ích này được tính chính xác ở giai đoạn 2 của thuật toán.
Ngoài ra, thuật toán thực hiện duyệt cơ sở dữ liệu nhiều lần sẽ gặp vấn đề về tốc độ
xử lý nếu cơ sở dữ liệu có lượng giao dịch lớn. Để giải quyết các vấn đề liên quan
đến việc có nhiều tập ứng viên được sinh ra làm giảm năng suất thực hiện của thuật
toán Two-Phase. Tseng và các đồng sự đã đề xuất thuật toán UP-Growth vào năm
2010 [4]. Thuật toán UP-Growth gồm hai bước chính. Bước 1, xây dựng cấu trúc
cây Up-Tree. Bước 2, xác định các tập mục hữu ích cao từ các tập mục hữu ích cao
tiềm năng (PHUIs). Trong giai đoạn đầu, thuật toán duyệt cơ sở dữ liệu để tính toán
TWU cho từng item. Sau đó, ở giai đoạn hai, thuật toán duyệt cơ sở dữ liệu và loại
bỏ những item có giá trị TWU nhỏ hơn ngưỡng độ hữu ích tối thiểu min-util ra khỏi
giao dịch tương ứng. Mặc dù hướng tiếp cận này của thuật toán UP-Growth sinh ra
ít ứng viên hơn trong giai đoạn 1. Việc duyệt CSDL gốc vẫn rất tốn thời gian do
CSDL gốc quá lớn và vẫn còn chứa nhiều mục không triển vọng
Một cải tiến của thuật toán Up-Growth [4] được Tseng và các đồng sự đề xuất vào
năm 2013 cũng nhằm mục đích khai thác các tập hữu ích cao, và được gọi tên là
Up-Growth+ [5]. Thuật toán áp dụng các kỹ thuật cắt tỉa để rút gọn các tập các ứng
viên. Sau khi tối ưu trên cây Up-Tree chúng ta sẽ có được tập các hữu ích cao tiềm
năng (PHUIs) ít hơn so với Up-Growth. Thuật toán này được đánh giá là dễ cài đặt
và có thời gian thực thi tốt hơn thuật toán Up-Growth vì chỉ thực hiện duyệt cơ sở
dữ liệu hai lần.
Liu và Qu đã đề xuất thuật toán HUI-Miner (High Utility Itemset Miner) [6] để khai
thác thác tập hữu ích cao sử dụng một cấu trúc mới, được gọi là danh sách lợi ích,
để lưu trữ tất cả các thông tin hữu ích về một tập và tìm ra thông tin để cắt tỉa không
gian tìm kiếm. Thuật toán HUI-Miner [6] được xem là thuật toán tốt nhất để khai
thác tập hữu ích cao cho đến khi có sự xuất hiện của thuật toán FHM [7], một thuật
toán khai thác tập hữu ích cao được đề xuất bởi Phillipe và các đồng sự vào năm
2014.
Khai thác luật kết hợp từ mẫu hữu ích cao
(16)
Bài toán khai thác luật kết hợp từ các mẫu hữu ích cao còn khá mới. Sahoo và
các đồng sự đã khởi đầu nghiên cứu và đề xuất thuật toán khai thác luật kết hợp hữu
ích cao [8] vào năm 2015. Thuật toán bao gồm ba giai đoạn chính, cụ thể như sau:
Giai đoạn 1: Khai thác các tâp hữu ích cao đóng và các tập sinh.
Giai đoạn 2: Thực thi thuật toán HGB để tìm ra tập luật căn bản (high utility generic
basic – HGB). Tập HGB được định nghĩa như sau: 𝐻𝐺𝐵 = {𝑅: 𝑔 →h∖𝑔|h ∈𝐻𝑈𝐶𝐼 ∧
𝑔 ∅, 𝑔⊂h, 𝑐𝑜𝑛𝑓(𝑅)≥𝑚𝑖𝑛−𝑢𝑐𝑜𝑛𝑓 ∧ ∄𝑔′ ⊂𝑔 ∧ 𝑐𝑜𝑛𝑓(𝑔′ → h ∖ 𝑔′) ≥ 𝑚𝑖𝑛 − 𝑢𝑐𝑜𝑛𝑓.
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Trong giai đoạn 2 này, Giai đoạn 3: Thực thi thuật toán HAR để tìm ra tập kết quả
tất cả các luật kết hợp hữu ích cao.
Tên của thuật toán chung cho toàn bộ quá trình là HGB-HAR. Thuật toán HGB-
HAR có khuyết điểm về mặt tính toán và tìm ra luật hợp lệ. Ngoài ra, luật sinh ra có
thể bị trùng với luật đang có trong tập kết quả, do đó lãng phí thời gian tính toán. Vì
vậy, thuật toán HGB-HAR chưa tối ưu về thời gian thực hiện.
3. Thuật toán đề xuất
3.1. Bài toán khai thác luật kết hợp hữu ích cao
(17)
Cho một cơ sở dữ liệu giao dịch D, ngưỡng độ hữu ích tối thiểu min-util và
ngưỡng độ tin cậy hữu ích tối thiểu min-uconf, bài toán khai thác luật kết hợp hữu
ích cao từ cơ sở dữ liệu D là tìm tất cả các luật có độ hữu ích lớn hơn hoặc bằng độ
hữu ích tối thiểu min-util và có độ tin cậy hữu ích lớn hơn hoặc bằng độ tin cậy hữu
ích tối thiểu.
3.2. Một số định nghĩa
Định nghĩa 1. Cho một tập mục hữu hạn chứa các mục I =i1, i2, ..., im, mỗi item ip
(1 ≤ p ≤ m) được gắn với một lợi nhuận cố định, được ký hiệu p(ip). Một tập mục X
gồm k mục phân biệt i1, i2, ..., ik, trong đó ij I, 1 ≤ j≤ k, k số phần tử trong tập
mục X. Một cơ sở dữ liệu giao dịch D = {T1, T2,...,Tn} gồm tập các giao dịch Td có
một định danh id, được gọi là Tid. Mỗi item ip trong mỗi giao dịch Td được gắn kết
với một trọng số được gọi là số lượng và được ký hiệu là q(ip, Td), tương ứng với item
ip được mua.
Định nghĩa 2. Độ hữu ích của một item i trong một giao dịch Td được ký hiệu là u(i,
Tq) và được định nghĩa bằng công thức p(i) × q(i, Td).
Định nghĩa 3. Độ hữu ích của một tập mục X trong giao dịch Td được ký hiệu là
u(X,Td) và được xác định bởi công thức: 𝑢 ( 𝑋 , 𝑇𝑑 ) = ∑ 𝑥 𝑖 ∈ 𝑋 𝑢 ( 𝑥 𝑖 , 𝑇𝑑 ) .
Định nghĩa 4. Độ hữu ích của một tập mục X trong cơ sở dữ liệu D được tính bằng
tổng tất cả các độ hữu ích của X trong tất cả các giao dịch có chứa X.
𝑢(𝑋)=∑𝑋⊆𝑇𝑑 ⋀𝑇𝑑∈𝐷 𝑢(𝑋, 𝑇𝑑).
Định nghĩa 5. Một tập mục X được xem là tập mục hữu ích cao (HUI) nếu X có độ
hữu ích bằng hoặc lớn hơn giá trị hữu ích tối thiểu mà người dùng định nghĩa (min-
util). Nếu tập mục X có độ hữu ích thấp hơn độ hữu ích tối thiểu thì X không phải là
tập mục hữu ích cao, hay còn gọi là tập mục hữu ích thấp.
Định nghĩa 6. Một tập mục Y được gọi là tập bao đóng của tập mục X nếu không có
tập cha nào của X chứa Y và có supp(X) = supp(Y), ký hiệu là 𝛾(𝑋). X được gọi là tập
hữu ích đóng nếu 𝑋 = 𝛾(𝑋) và u(X) ≥ min-util.
Định nghĩa 7. Một tập mục X được gọi là tập sinh hữu ích cao (HUI Generator) nếu X
là tập mục hữu ích cao và không có tập con Z nào của X sao cho supp(X) = supp(Z).
Định nghĩa 8. Độ hữu ích cục bộ của một item xi trong tập mục X, ký hiệu 𝑙𝑢𝑣 (𝑥𝑖 , 𝑋)
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
và được tính bằng tổng độ hữu ích của xi trong tất cả giao dịch có chứa X, được xác
định bằng công thức sau:
𝑙𝑢𝑣(𝑥𝑖,𝑋)= ∑𝑋⊆𝑡𝑑 ⋀𝑡𝑑∈𝐷𝑢(𝑥𝑖,𝑡𝑑).
Định nghĩa 9. Với X = x1, x2, ..., xnlà một tập mục n phần
tử, mảng đơn vị độ hữu ích của X được ký hiệu U(X) = u1, u2, ..., un, trong đó 𝑢𝑖 =
𝑙𝑢𝑣 (𝑥𝑖, 𝑋), 𝑖 ∈ {1,2, ..., 𝑛}.
Định nghĩa 10. Độ hữu ích cục bộ của tập mục X trong tập mục Y (𝑋 ⊆ 𝑌), ký hiệu là
𝑙𝑢𝑣 (𝑋, 𝑌) và được định nghĩa bằng tổng các độ hữu ích cục bộ của tất cả item 𝑥𝑖 ∈𝑋
trong Y. Công thức tính độ hữu ích cục bộ của tập mục X trong tập mục Y được biểu
diễn như sau:
𝑙𝑢𝑣(𝑋,𝑌)= ∑𝑥𝑖∈𝑋⊆𝑌𝑙𝑢𝑣(𝑥𝑖,𝑌).
Định nghĩa 11. Luật kết hợp hữu ích R là một hàm biểu diễn mối quan hệ giữa hai tập
hữu ích cao X, Y ⊆ I, được biểu diễn dưới dạng 𝑋 → 𝑌. Độ tin cậy hữu ích của luật R,
ký hiệu là uconf(R), được xác định bằng công thức:
𝑅:𝑋→𝑌được gọi là luật kết hợp hữu ích cao nếu giá trị của uconf(R) lớn hơn hoặc
bằng độ tin cậy hữu ích tối thiểu (min- uconf) do người dung định nghĩa. Ngược lại, R
được gọi là luật kết hợp hữu ích thấp.
Tính chất 1. Cho 𝑅1: 𝑋 → 𝑌, 𝑅2: 𝑋 → 𝑍 (𝑌 ⊂ 𝑍) là hai luật kết hợp trong mô hình độ
tin cậy – hữu ích (utility- confidence framework), nếu R1 không phải là luật kết hợp
hữu ích cao, thì R2 cũng không phải là luật kết hợp hữu ích cao.
Định nghĩa 12. Cho 𝑅1:𝑋1 → 𝑌1 và 𝑅2:𝑋2 → 𝑌2 là hai luật kết hợp hữu ích cao trong
mô hình độ tin cậy – hữu ích. R2 được xác định là dư thừa so với R1 nếu 𝑋2 ⋃𝑌2 ⊆
𝑋1 ⋃ 𝑌1, 𝑅1. 𝑢𝑡𝑖𝑙𝑖𝑡𝑦 ≥ 𝑅2. 𝑈𝑡𝑖𝑙𝑖𝑡𝑦 , 𝑠𝑢𝑝𝑝𝑜𝑟𝑡 (𝑅1) = 𝑠𝑢𝑝𝑝𝑜𝑟𝑡 (𝑅2) và 𝑋1 ⊆ 𝑋2, 𝑌2
⊆ 𝑌1, trong đó 𝑅𝑖. 𝑢𝑡𝑖𝑙𝑖𝑡𝑦 là độ hữu ích của luật𝑅i,i=1,2, và độ hỗ trợ của luật R:𝑋→𝑌
là supp(𝑋⋃𝑌).
3.3 Thuật toán
Thuật toán HUIL
Đầu vào: Tập HUIs được sắp xếp theo thứ tự phần tử tăng dần (TableHUI)
Đầu ra: dàn HUIL với nút gốc rootNode.
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Thuật toán xây dựng dàn từ các HUIs được thực hiện như sau:
Đầu tiên, thuật toán HUIL sẽ gọi hàm BuildLattice để xây dựng nút gốc cho dàn. Nút
gốc là một nút rỗng không có chứa HUI, không có giá trị hữu ích và độ hỗ trợ.
Tiếp theo, thuật toán duyệt qua tất cả các HUIs theo thứ tự sắp xếp số phần tử tăng
dần. Khi xét mỗi HUI, thuật toán sẽ khởi tạo lại giá trị của cờ IsTraversed cho nút gốc
và các nút con.
Sau đó, thuật toán gọi hàm InsertLattice để thực hiện thêm HUI vào dàn. Trong hàm
InsertLattice, cờ được sử dụng để xác định xem HUI đang xét {X} có thể được thêm
trực tiếp vào nút đang xét hay không. Nếu nút đang xét rootNode có các nút con
𝑐h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 sao cho 𝑐h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 ⊂ 𝑋 (dòng 23), hàm InsertLattice sẽ được gọi đệ quy
(dòng 25) để thêm nút {X} vào dàn. Nếu không có nút con childNode nào sao cho
𝑐h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 ∈ 𝑟𝑜𝑜𝑡𝑁𝑜𝑑𝑒. 𝐶h𝑖𝑙𝑑𝑟𝑒𝑛 và 𝐶h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 ⊂ 𝑋, X sẽ là nút con trực tiếp của
nút đang xét rootNode (dòng 29).
4. Thực nghiệm
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
4.1. Môi trường thực nghiệm
(18)
Các thuật toán đề xuất được cài đặt và thực nghiệm trên môi trường có cấu hình như
sau: Intel Core I7-7500U 2.5 GHz, Ram 16 GB, hệ điều hành Windows 10, phiên bản
64 bit. Công cụ dùng để phát triển thuật toán: Visual Studio 2015 Community, .Net
framework 4.5, ngôn ngữ C#.
4.2. Cơ sở dữ liệu thực nghiệm
(19)
Các cơ sở dữ liệu dùng cho thực nghiệm là các cơ sở dữ liệu chuẩn được tải từ
website mã nguồn mở SPMF phát triển bởi Philippe (http://www.philippe-fournier-
viger.com/ spmf/ index.php?link=datasets.php). Các thuộc tính của cơ sở dữ liệu được
mô tả trong Bảng 1.
4.3. Kết quả thực nghiệm
(20)
Thuật toán FHIM được đề xuất bởi Sahoo và các đồng sự [8] được dùng để khai
thác các tập mục hữu ích cao từ các cơ sở dữ liệu được đề cập ở trên. Sau đó thuật toán
được đề xuất sẽ được thực thi với các thông số đầu vào bao gồm các tập hữu ích cao,
độ hữu ích tối thiểu min-util, độ tin cậy hữu ích tối thiểu min-uconf.
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
(21)
Kết quả luật kết hợp hữu ích cao với độ tin cậy hữu ích tối thiểu 60% - 80% và các
độ hữu ích tối thiểu tương ứng của từng cơ sở dữ liệu được liệt kê trong Bảng 2.
4.4. So sánh về thời gian
(22)
Thuật toán đề xuất LARM có thời gian thực thi tối ưu nhờ vào cải tiến không gian
tìm kiếm thông qua việc áp dụng tính chất 1 đã đề cập ở trên. Kết quả là số cặp itemset
cần xét để hình thành luật giảm.
(23)
Trong phần tiếp theo của thực nghiệm, các đồ thị so sánh về thời gian thực thi sử
dụng giữa hai thuật toán LARM và HGB-HAR sẽ được trình bày dưới dạng đồ thị sử
dụng tỉ lệ thang logarit của 10. Một số ký hiệu cho các đường biểu diễn trên đồ thị cụ
thể như sau.
LARM: biểu diễn cho thời gian thực thi để khai thác luật kết hợp hữu ích cao, bao
gồm thời gian xây dựng dàn và thời gian rút trích luật. HGB-HAR: biểu diễn cho thời
gian thực thi của thuật toán HGB-HAR
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
Kết quả từ Hình 2 đến Hình 5 có thể đánh giá được rằng thuật toán LARM là thuật
toán có thời gian thực thi tối ưu. Bên cạnh đó, nếu không xét đến thời gian xây dựng
dàn, thuật toán LARM sẽ sử dụng rất ít thời gian để tìm kết quả luật kết hợp hữu ích
cao. Các kết quả thực nghiệm trên các CSDL đã chứng minh ưu thế của việc sử dụng
dàn trong khai thác luật kết hợp, đặc biệt là luật kết hợp hữu ích cao.
5. Kết luận và hướng phát triển
5.1. Kết luận
(24)
Trong nghiên cứu này, tác giả sử dụng mô hình độ tin cậy hữu ích và lý thuyết dàn
để khai thác luật kết hợp hữu ích cao nhằm khai thác mối quan hệ giữa các tập mục
hữu ích cao. (25)
Nghiên cứu này là nghiên cứu đầu tiên áp dụng lý thuyết về dàn trong
khai thác luật kết hợp hữu ích cao. (26)
Tác giả đã đề xuất thuật toán HUIL để xây dựng
dàn gồm các tập mục hữu ích cao. (27)
Kết quả thực nghiệm trên một số cơ sở dữ liệu
chuẩn cho thấy thuật toán đã đề xuất, LARM, có hiệu quả cao cả về thời gian thực thi
và bộ nhớ sử dụng. (28)
Tính hiệu quả của thuật toán sẽ đóng góp rất lớn trong các hệ
thống dự báo và ra quyết định.
(29)
Nghiên cứu này có thể được ứng dụng hiệu quả trong sản xuất kinh doanh, lập kế
hoạch kinh doanh cũng như cuộc sống dựa vào đặc điểm và tính chất ứng dụng luật
ứng với mỗi luật trong tập luật. (30)
Kết quả từ các luật kết hợp hữu ích cao sẽ mang lại
kết quả hữu ích cho lãnh đạo trong khi hoạch định kế hoạch sản xuất, kinh doanh trong
thời gian sắp tới, điển hình như xem xét các tập mặt hàng kết hợp với nhau mang lại
lợi nhuận cao trong hoạt động kinh doanh bán lẻ, hoặc để xuất các chương trình
khuyến mãi nhằm mang lại hiệu quả kinh doanh cao nhất.
5.2. Hướng phát triển
Bằng cách sử dụng thuật toán HUIL để xây dựng kiến trúc dàn các tập hữu ích cao,
nghiên cứu này có thể mở rộng phát triển các thuật toán khai thác luật kết hợp hữu ích
cao không dư thừa, ngoài ra, có thể phát triển thuật toán khai thác các tập đóng hữu ích
cao (closed high utility itemsets) và tập sinh hữu ích cao (high utility generators). Bên
cạnh đó, các độ đo thú vị [9], [10] có thể được nghiên cứu áp dụng vào các thuật toán
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
đã đề xuất nhằm tăng thêm tính hiệu quả và khai thác thêm các thông tin hữu ích từ
các cơ sở dữ liệu giao dịch.
Lời cảm ơn
Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và công nghệ NTTU trong đề
tài mã số 2017.01.75.
Mining association rules from high utility itemsets
Nguyen Thi Thuy Loan1, Mai Hoang Thang2
1Nguyen Tat Thanh University
2NashTech Global
Abstract Most companies focus on their profit growth within the business environment. For example,
supermarkets often analyze sales activities to investigate which products bring the most revenue. In order to
solve the problem, we need to mine high utility item sets. Recently, there have been many researches focus on
this problem. However, these methods consume more time and memory usage. In this paper, we propose an
algorithm for saving the mining time and memory usage during mining process.
Key words Data mining, high utility itemsets, association rules.
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
[3]
Chủ động ứng phó với tình trạng dịch bệnh kéo dài
(ĐCSVN) - (31)
Bộ Y tế xác định tập trung nguồn lực truy vết để phát hiện sớm
người bệnh, hạn chế sự lây lan của virus SARS-CoV-2, đồng thời điều trị sớm,
hạn chế những biến chứng do các bệnh lý nền hoặc do COVID-19, đó là hai mũi
giáp công cần được thực hiện để hạn chế thấp nhất những tác động mà dịch gây
ra.
Dịch sẽ tiếp tục kéo dài, xuất hiện các chùm ca bệnh và ca bệnh tại cộng đồng
(32)
Theo nhận định của Bộ Y tế, mặc dù chúng ta đang kiểm soát được tình hình dịch
bệnh COVID-19 tại Đà Nẵng, Quảng Nam và một số địa phương khác, tuy nhiên tình
hình dịch sẽ tiếp tục kéo dài và xuất hiện các chùm ca bệnh và ca bệnh tại cộng đồng,
do đó các địa phương phải nâng mức cảnh giác ở mức cao nhất để phát hiện sớm và
kịp thời cách ly, khoanh vùng, dập dịch để tránh dịch bệnh lây lan ra cộng đồng.
Xét nghiệm virus SARS-CoV-2 tại Đà Nẵng. (Ảnh: Tuấn Dũng)
(33)
Tại buổi giao ban trực tuyến về công tác phòng, chống dịch với lãnh đạo sở y tế các
địa phương chiều 19/8, Quyền Bộ trưởng Y tế Nguyễn Thanh Long cho biết ổ dịch ở
Quảng Nam, Quảng Ngãi và Đà Nẵng đang từng bước được kiểm soát. (34)
Số ca mắc
giảm dần trong những ngày gần đây. (35)
Từ bài học của Đà Nẵng, Quảng Nam và Hải
Dương, Quyền Bộ trưởng cho rằng vấn đề đặt ra là các địa phương phải làm gì khi
dịch bệnh xảy ra. (36)
Thực tế, nhiều địa phương còn lúng túng trong cách xử lý. (37)
Đó
là lý do Bộ Y tế phải thường xuyên điều chuyên gia trung ương hỗ trợ các địa phương.
“Khi xảy ra dịch ở các địa phương khác sẽ không kém phần như Đà Nẵng. Đà Nẵng là
một ví dụ về vấn đề con người, cơ sở cấp cứu, dù chúng ta đã nỗ lực nhưng khổng thể
cấp cứu mà phải huy động tổng lực từ trung ương đến hỗ trợ. Vậy nếu dịch xảy ra tại
một tỉnh miền núi thì sẽ càng khó khăn hơn. Chúng ta phải xác định từ nay trở đi sẽ
không có lúc nào bình yên mà sẵn sàng có dịch”- Quyền Bộ trưởng nói.
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
(38)
Ông Nguyễn Thanh Long cho hay chúng ta đang tìm mọi phương pháp để tiếp cận
vaccine ngừa COVID-19. (39)
Thời gian dự kiến sớm nhất là 6 tháng cuối năm 2021
vaccine có thể đến với người dân. Vì vậy, (40)
người dân cần sẵn sàng chiến đấu với
dịch. (41)
Các địa phương phải chuẩn bị cho tâm thế dịch sẽ kéo dài, nếu không có
vaccine, cuộc chiến chống dịch rất khó khăn.
(42)
Quyền Bộ trưởng Nguyễn Thanh Long cũng đề nghị các địa phương chủ động
chống dịch theo phương châm 4 tại chỗ. Trung ương sẽ hỗ trợ khi cần thiết. (43)
Ngoài
ra, các địa phương cần chủ động mua sắm trang thiết bị, sinh phẩm và thực hiện sàng
lọc theo đúng quy định để được bảo hiểm y tế thanh toán. (44)
Tuy nhiên, việc sàng lọc
trong cộng đồng sẽ không được thanh toán.
(45)
Về vấn đề trang thiết bị phòng hộ cho chống dịch, các tỉnh, thành phải đảm bảo
giường cấp cứu, nhân lực. Trường hợp khoa chạy thận nhân tạo có bệnh nhân phải lập
tức tách những người đang điều trị đến khu vực khác. Quyền Bộ trưởng Y tế nhấn
mạnh các cơ sở y tế tuyệt đối không được chủ quan.
(46)
Theo Quyền Bộ trưởng Y tế, đến nay, cả nước có khoảng 150 ổ dịch. (47)
Ngành y tế
đã có nhiều bài học trong phòng, chống dịch như chần chừ sẽ rất nguy hiểm, phải truy
tìm, cách ly nhanh để đưa mầm bệnh ra khỏi cư dân, cộng đồng. Tiếp theo, các cơ sở y
tế phải có kế hoạch ứng phó để tránh trường hợp phong tỏa một loạt bệnh viện sẽ khó
khăn trong điều trị người dân cần cấp cứu; phải tính sẵn phương án các bệnh viện sẽ
hỗ trợ, tiếp nhận bệnh nhân trong tình huống trên địa bàn có cơ sở y tế bị "đóng băng".
Do đó, địa phương phải rà soát lại tất cả các kịch bản ứng phó phòng chống dịch trên
nhiều cấp độ, từ cách ly, khoanh vùng, dập dịch, điều trị, xét nghiệm..., trong đó có
vấn đề tập huấn cho cán bộ y tế về truy vết, lấy mẫu... và cả vấn đề bệnh viện dã chiến
trong trường hợp cần thiết…
"Chúng ta phải bảo vệ điểm cốt tử của bệnh viện như khoa hồi sức, chạy thận nhân tạo
và đội ngũ nhân viên y tế. Chúng ta không được nghĩ bệnh viện ngoại khoa, chuyên
khoa đặc biệt sẽ không có COVID-19, phải sẵn sàng tâm thế chống dịch”- Quyền Bộ
trưởng Bộ Y tế lưu ý.
(48)
Nhấn mạnh công tác giám sát rất quan trọng, lãnh đạo Bộ Y tế đã yêu cầu các nhà
thuốc phải giám sát chặt các trường hợp mua thuốc nghi ngờ như ốm, ho, sốt, ... nếu
không báo cho cơ sở y tế thì yêu cầu xử lý nghiêm. (49)
Đối với các bệnh viện, nếu để
tình trạng bệnh nhân nghi ngờ “lọt” thì cũng sẽ bị xử lý nghiêm.
(50)
Trong đợt dịch bùng phát mới đây, Đà Nẵng có số ca nhiễm SARS-CoV-2 cao nhất
cả nước, tiếp theo là Quảng Nam. Ngoài ra, các tỉnh, thành khác có dịch là TP. Hồ Chí
Minh, Đắk Lắk, Quảng Ngãi, Thái Bình, Đồng Nai, Hà Nam, Bắc Giang, Lạng Sơn,
Quảng Trị, Thanh Hóa, Khánh Hòa, Hải Dương, Hà Nội.
…
Đỗ Thoa
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
[4]
EFFICIENT ALGORITHMS FOR MINING TOP-K HIGH UTILITY ITEMSETS
Vincent S. Tseng, Senior Member, Cheng-Wei Wu, Philippe Fournier-Viger,
Philip S. Yu, Fellow, IEEE
(51)
FREQUENT itemset mining (FIM) [1, 3, 8, 9, 18, 19, 20, 28, 29] is a
fundamental research topic in data mining. (52)
However, the traditional FIM may
discover a large amount of frequent but low-value itemsets and lose the information on
valuable itemsets having low selling frequencies. (53)
Hence, it cannot satisfy the
requirement of users who desire to discover itemsets with high utilities such as high
profits. (54)
To address these issues, utility mining [2, 4, 7, 10-18, 22, 23, 25, 26, 27, 29,
34, 35, 36] emerges as an important topic in data mining and has received extensive
attention in recent years. (55)
In utility mining, each item is associated with a utility (e.g.
unit profit) and an occurrence count in each transaction (e.g. quantity). (56)
The utility
of an itemset represents its importance, which can be measured in terms of weight,
value, quantity or other information depending on the user specification. (57)
An itemset
is called high utility itemset (HUI) if its utility is no less than a user-specified minimum
utility threshold min_util. (58)
HUI mining is essential to many applications such as
streaming analysis [2, 11, 35], market analysis [13, 17, 22], mobile computing [23]
and biomedicine [4].
(59)
However, efficiently mining HUIs in databases is not an easy task because the
downward closure property [1, 8] used in FIM does not hold for the utility of itemsets.
(60)
In other words, pruning search space for HUI mining is dif- ficult because a
superset of a low utility itemset can be high utility. (61)
To tackle this problem, the
concept of transaction-weighted utilization (TWU) model [13] was introduced to
facilitate the performance of the mining task. (62)
In this model, an itemset is called high
transaction-weighted utilization itemset (HTWUI) if its TWU is no less than min_util,
where the TWU of an itemset represents an upper bound on its utility. (63)
Therefore, a
HUI must be a HTWUI and all the HUIs must be included in the complete set of
HTWUIs. (64)
A classical TWU model-based algorithm con- sists of two phases. (65)
In
the first phase, called phase I, the complete set of HTWUIs are found. (66)
In the second
phase, called phase II, all HUIs are obtained by calculating the exact utilities of
HTWUIs with one database scan.
(67)
Although many studies have been devoted to HUI mining, it is difficult for users
to choose an appropriate minimum utility threshold in practice. (68)
Depending on the
threshold, the output size can be very small or very large. (69)
Besides, the choice of the
threshold greatly influences the performance of the algorithms. (70)
If the threshold is
set too low, too many HUIs will be presented to the users and it is difficult for the
users to comprehend the results. (71)
A large number of HUIs also causes the mining
algorithms to become inefficient or even run out of memory, because the more HUIs
the algorithms generate, the more re- sources they consume. (72)
On the contrary, if the
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
threshold is set too high, no HUI will be found. (73)
To find an appropriate value for the
min_util threshold, users need to try different thresholds by guessing and re-executing
the algorithms over and over until being satisfied with the results. (74)
This process is
both inconvenient and time-consuming.
(75)
To precisely control the output size and discover the itemsets with the highest
utilities without setting the thre- sholds, a promising solution is to redefine the task of
mining HUIs as mining top-k high utility itemsets (top-k HUIs). (76)
The idea is to let the
users specify k, i.e., the number of desired itemsets, instead of specifying the minimum
utility threshold. (77)
Setting k is more intuitive than setting the threshold because k
represents the number of itemsets that the users want to find whereas choosing the
threshold depends primarily on database characteristics, which are often unknown to
users.
(78)
Using a parameter k instead of the min_util threshold is very desirable for
many applications. (79)
For example, to analyze customer purchase behavior, top-k HUI
mining serves as a promising solution for users who desire to know (80)
“What are the
top-k sets of products (i.e., itemsets) that contribute the highest profits to the
company?” and “How to efficiently find these itemsets without setting the min_util
threshold?”. (81)
Although top-k HUI mining is es- sential to many applications,
developing efficient algorithms for mining such patterns is not an easy task. (82)
It poses
four major challenges as discussed below.
(83)
First, the utility of itemsets is neither monotone nor anti- monotone [1, 8]. (84)
In
other words, the utility of an itemset may be equal to, higher or lower than that of its
supersets and subsets. (85)
Therefore, many techniques developed in top-k frequent
pattern mining that rely on anti-monotonicity to prune the search space cannot be
directly applied to top-k high utility itemset mining.
(86)
The second challenge is how to incorporate the concept of top-k pattern mining
with the TWU model. (87)
Although the TWU model is widely used in utility mining, it is
difficult to adapt this model to top-k HUI mining because the exact utilities of itemsets
are unknown in phase I. (88)
When a HTWUI is generated in phase I, we cannot
guarantee that its utility is higher than other HTWUIs and that it is a top-k HUI before
performing phase II. (89)
To guarantee that all the top-k HUIs can be captured in the set
of HTWUIs, a naive approach is to run the algorithm with min_util = 0. (90)
However,
this approach may face the prob- lem of a very large search space.
(91)
The third challenge is that the min_util threshold is not given in advance in top-
k HUI mining. (92)
In traditional HUI mining, the search space can be efficiently pruned
by the algorithms by using a given min_util threshold. (93)
However, in the scenario of
top-k HUI mining, no min_util threshold is provided in advance. (94)
Therefore, the
minimum utility threshold is initially set to 0 and the designed algorithm has to
gradually raise the threshold to prune the search space. (95)
Such a threshold is an
internal parameter of the designed algorithm and is called the border minimum utility
threshold min_utilBorder in this paper. (96)
It is different from the external parameter
Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149
min_util that is given by users in advance. (97)
If an algorithm cannot raise the
min_utilBorder threshold effectively and efficiently, it would produce too many
intermediate low utility itemsets during the mining process, which may degrade its
performance in terms of execution time and memory usage. (98)
Thus the challenge is to
design effective strategies that can raise the min_util threshold as high as possible and
as quickly as possible, and further reduce as much as possible the number of
candidates and intermediate low utility itemsets pro- duced in the mining process.
(99)
The last challenge is how to effectively raise the min_utilBorder threshold
without missing any top-k HUIs. (100)
A good algorithm is one that can effectively raise
the thre- shold during the mining process.

More Related Content

What's hot

DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG
DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG
DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG Lê Thương
 
Báo cáo thực tập tiếng anh biên phiên dịch tại công ty
 Báo cáo thực tập tiếng anh biên phiên dịch tại công ty  Báo cáo thực tập tiếng anh biên phiên dịch tại công ty
Báo cáo thực tập tiếng anh biên phiên dịch tại công ty Luanvantot.com 0934.573.149
 
đốI chiếu phụ âm tv ta
đốI chiếu phụ âm tv tađốI chiếu phụ âm tv ta
đốI chiếu phụ âm tv tayinnyluhan
 
Bai giang ngon ngu hoc doi chieu
Bai giang ngon ngu hoc doi chieuBai giang ngon ngu hoc doi chieu
Bai giang ngon ngu hoc doi chieuCún Con Sữa
 
Cẩm nang hướng dẫn làm bài thi vstep
Cẩm nang hướng dẫn làm bài thi vstepCẩm nang hướng dẫn làm bài thi vstep
Cẩm nang hướng dẫn làm bài thi vstepDương Hoàng Nhơn
 
Translation by omission
Translation by omissionTranslation by omission
Translation by omissionKhanhHoa Tran
 
FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...
FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...
FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...Viết thuê báo cáo thực tập giá rẻ
 
Đề và đáp án Linguistic 2
Đề và đáp án Linguistic 2Đề và đáp án Linguistic 2
Đề và đáp án Linguistic 2Hien Ngo
 
Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...
Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...
Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...Viết thuê báo cáo thực tập giá rẻ
 

What's hot (20)

Đề tài: Báo cáo thực tập tại trung tâm anh ngữ, HAY
Đề tài: Báo cáo thực tập tại trung tâm anh ngữ, HAYĐề tài: Báo cáo thực tập tại trung tâm anh ngữ, HAY
Đề tài: Báo cáo thực tập tại trung tâm anh ngữ, HAY
 
An investigation into the English translational versions of Trinh Cong Son’s ...
An investigation into the English translational versions of Trinh Cong Son’s ...An investigation into the English translational versions of Trinh Cong Son’s ...
An investigation into the English translational versions of Trinh Cong Son’s ...
 
A study on common pronunciation mistakes and recommended solution
A study on common pronunciation mistakes and recommended solutionA study on common pronunciation mistakes and recommended solution
A study on common pronunciation mistakes and recommended solution
 
Những khó khăn khi phiên dịch cho giáo viên nước ngoài trong các lớp tiếng An...
Những khó khăn khi phiên dịch cho giáo viên nước ngoài trong các lớp tiếng An...Những khó khăn khi phiên dịch cho giáo viên nước ngoài trong các lớp tiếng An...
Những khó khăn khi phiên dịch cho giáo viên nước ngoài trong các lớp tiếng An...
 
DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG
DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG
DẪN LUẬN NGÔN NGỮ HỌC_TỪ VỰNG
 
Báo cáo thực tập tiếng anh biên phiên dịch tại công ty
 Báo cáo thực tập tiếng anh biên phiên dịch tại công ty  Báo cáo thực tập tiếng anh biên phiên dịch tại công ty
Báo cáo thực tập tiếng anh biên phiên dịch tại công ty
 
đốI chiếu phụ âm tv ta
đốI chiếu phụ âm tv tađốI chiếu phụ âm tv ta
đốI chiếu phụ âm tv ta
 
luan van thac si A study on common pronunciation mistakes and recommended sol...
luan van thac si A study on common pronunciation mistakes and recommended sol...luan van thac si A study on common pronunciation mistakes and recommended sol...
luan van thac si A study on common pronunciation mistakes and recommended sol...
 
Danh Sách 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Ngôn Ngữ Anh
Danh Sách 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Ngôn Ngữ AnhDanh Sách 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Ngôn Ngữ Anh
Danh Sách 200 Đề Tài Khóa Luận Tốt Nghiệp Ngành Ngôn Ngữ Anh
 
Bai giang ngon ngu hoc doi chieu
Bai giang ngon ngu hoc doi chieuBai giang ngon ngu hoc doi chieu
Bai giang ngon ngu hoc doi chieu
 
Cẩm nang hướng dẫn làm bài thi vstep
Cẩm nang hướng dẫn làm bài thi vstepCẩm nang hướng dẫn làm bài thi vstep
Cẩm nang hướng dẫn làm bài thi vstep
 
Báo Cáo Thực Tập Tiếng Anh, Ngôn Ngữ Anh Tại Khách Sạn.docx
Báo Cáo Thực Tập Tiếng Anh, Ngôn Ngữ Anh Tại Khách Sạn.docxBáo Cáo Thực Tập Tiếng Anh, Ngôn Ngữ Anh Tại Khách Sạn.docx
Báo Cáo Thực Tập Tiếng Anh, Ngôn Ngữ Anh Tại Khách Sạn.docx
 
Luận văn Thạc sĩ a study on common grmmatical errors in essays written by thi...
Luận văn Thạc sĩ a study on common grmmatical errors in essays written by thi...Luận văn Thạc sĩ a study on common grmmatical errors in essays written by thi...
Luận văn Thạc sĩ a study on common grmmatical errors in essays written by thi...
 
Translation by omission
Translation by omissionTranslation by omission
Translation by omission
 
FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...
FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...
FREE Dẫn luận ngôn ngữ. Các phương thức ngữ pháp có trong tiếng Anh,...
 
Báo cáo thực tập tại trung tâm Anh ngữ.
Báo cáo thực tập tại trung tâm Anh ngữ.Báo cáo thực tập tại trung tâm Anh ngữ.
Báo cáo thực tập tại trung tâm Anh ngữ.
 
Đề và đáp án Linguistic 2
Đề và đáp án Linguistic 2Đề và đáp án Linguistic 2
Đề và đáp án Linguistic 2
 
Báo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Tiếng Trung.doc
Báo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Tiếng Trung.docBáo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Tiếng Trung.doc
Báo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Tiếng Trung.doc
 
Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...
Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...
Ngôn ngữ học đối chiếu - Dành cho SV ngoại ngữ - Dẫn luận ngôn ngữ ...
 
Đề tài: Những khó khăn thường gặp khi sử dụng tiếng Anh trong biên dịch văn b...
Đề tài: Những khó khăn thường gặp khi sử dụng tiếng Anh trong biên dịch văn b...Đề tài: Những khó khăn thường gặp khi sử dụng tiếng Anh trong biên dịch văn b...
Đề tài: Những khó khăn thường gặp khi sử dụng tiếng Anh trong biên dịch văn b...
 

Similar to Internship Report Faculty Of Foreign Languages Đại Học Đại Nam.docx

Similar to Internship Report Faculty Of Foreign Languages Đại Học Đại Nam.docx (20)

Graduation Internship Report - Some Translation Techniques Apply For Scientif...
Graduation Internship Report - Some Translation Techniques Apply For Scientif...Graduation Internship Report - Some Translation Techniques Apply For Scientif...
Graduation Internship Report - Some Translation Techniques Apply For Scientif...
 
Graduation Project Report - Some Techniques Applied For Translating Scientifi...
Graduation Project Report - Some Techniques Applied For Translating Scientifi...Graduation Project Report - Some Techniques Applied For Translating Scientifi...
Graduation Project Report - Some Techniques Applied For Translating Scientifi...
 
Some translation techniques applied in translating scientific articles.docx
Some translation techniques applied in translating scientific articles.docxSome translation techniques applied in translating scientific articles.docx
Some translation techniques applied in translating scientific articles.docx
 
Some Translation Techniques Applied For Scientific Articles.docx
Some Translation Techniques Applied For Scientific Articles.docxSome Translation Techniques Applied For Scientific Articles.docx
Some Translation Techniques Applied For Scientific Articles.docx
 
INTERNSHIP REPORT ASSIGNMENT ON TRANSLATION HANOI OPEN UNIVERSITY.doc
INTERNSHIP REPORT ASSIGNMENT ON TRANSLATION HANOI OPEN UNIVERSITY.docINTERNSHIP REPORT ASSIGNMENT ON TRANSLATION HANOI OPEN UNIVERSITY.doc
INTERNSHIP REPORT ASSIGNMENT ON TRANSLATION HANOI OPEN UNIVERSITY.doc
 
Graduation Report Improving Foreign Language Ability For Students.docx
Graduation Report Improving Foreign Language Ability For Students.docxGraduation Report Improving Foreign Language Ability For Students.docx
Graduation Report Improving Foreign Language Ability For Students.docx
 
Giải pháp nâng cao hiệu quả công tác quản trị nguồn nhân lực của công ty Kim ...
Giải pháp nâng cao hiệu quả công tác quản trị nguồn nhân lực của công ty Kim ...Giải pháp nâng cao hiệu quả công tác quản trị nguồn nhân lực của công ty Kim ...
Giải pháp nâng cao hiệu quả công tác quản trị nguồn nhân lực của công ty Kim ...
 
Báo cáo tốt nghiệp Quản lý tài chính tại Kho bạc Nhà nước Bình Phước.doc
Báo cáo tốt nghiệp Quản lý tài chính tại Kho bạc Nhà nước Bình Phước.docBáo cáo tốt nghiệp Quản lý tài chính tại Kho bạc Nhà nước Bình Phước.doc
Báo cáo tốt nghiệp Quản lý tài chính tại Kho bạc Nhà nước Bình Phước.doc
 
Báo cáo thực tập Quyền và nghĩa vụ của cổ đông trong công ty cổ phần, 9 điểm....
Báo cáo thực tập Quyền và nghĩa vụ của cổ đông trong công ty cổ phần, 9 điểm....Báo cáo thực tập Quyền và nghĩa vụ của cổ đông trong công ty cổ phần, 9 điểm....
Báo cáo thực tập Quyền và nghĩa vụ của cổ đông trong công ty cổ phần, 9 điểm....
 
Luận văn thạc sĩ Dạy học thơ đường ở trường phổ thông theo hướng tích cực.doc
Luận văn thạc sĩ Dạy học thơ đường ở trường phổ thông theo hướng tích cực.docLuận văn thạc sĩ Dạy học thơ đường ở trường phổ thông theo hướng tích cực.doc
Luận văn thạc sĩ Dạy học thơ đường ở trường phổ thông theo hướng tích cực.doc
 
Khóa luận tốt nghiệp Khoa Quản lý công Trường Đại học nội vụ Hà Nội.doc
Khóa luận tốt nghiệp Khoa Quản lý công Trường Đại học nội vụ Hà Nội.docKhóa luận tốt nghiệp Khoa Quản lý công Trường Đại học nội vụ Hà Nội.doc
Khóa luận tốt nghiệp Khoa Quản lý công Trường Đại học nội vụ Hà Nội.doc
 
Những Lỗi Phổ Biến Trong Quá Trình Dịch Thuật Tiếng Trung.doc
Những Lỗi Phổ Biến Trong Quá Trình Dịch Thuật Tiếng Trung.docNhững Lỗi Phổ Biến Trong Quá Trình Dịch Thuật Tiếng Trung.doc
Những Lỗi Phổ Biến Trong Quá Trình Dịch Thuật Tiếng Trung.doc
 
Báo cáo kiến tập Thực trạng công tác quản lý văn bản đi tại Văn phòng thành p...
Báo cáo kiến tập Thực trạng công tác quản lý văn bản đi tại Văn phòng thành p...Báo cáo kiến tập Thực trạng công tác quản lý văn bản đi tại Văn phòng thành p...
Báo cáo kiến tập Thực trạng công tác quản lý văn bản đi tại Văn phòng thành p...
 
Báo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Xuất Khẩu Lao Động.docx
Báo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Xuất Khẩu Lao Động.docxBáo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Xuất Khẩu Lao Động.docx
Báo Cáo Thực Tập Tại Trung Tâm Ngoại Ngữ Xuất Khẩu Lao Động.docx
 
Faculty of Foreign Languages - Department of Translation & Interpretation.doc
Faculty of Foreign Languages - Department of Translation & Interpretation.docFaculty of Foreign Languages - Department of Translation & Interpretation.doc
Faculty of Foreign Languages - Department of Translation & Interpretation.doc
 
Khóa luận tốt nghiệp Các phạm vi sử dụng của uyển ngữ trong tiếng Hán và tiến...
Khóa luận tốt nghiệp Các phạm vi sử dụng của uyển ngữ trong tiếng Hán và tiến...Khóa luận tốt nghiệp Các phạm vi sử dụng của uyển ngữ trong tiếng Hán và tiến...
Khóa luận tốt nghiệp Các phạm vi sử dụng của uyển ngữ trong tiếng Hán và tiến...
 
Nâng cao hiệu quả hoạt động bán hàng của Công ty Đầu tư Phi Nam.doc
Nâng cao hiệu quả hoạt động bán hàng của Công ty Đầu tư Phi Nam.docNâng cao hiệu quả hoạt động bán hàng của Công ty Đầu tư Phi Nam.doc
Nâng cao hiệu quả hoạt động bán hàng của Công ty Đầu tư Phi Nam.doc
 
Internship Report Steps To Become A Merchandiser At Smi Furniture.doc
Internship Report Steps To Become A Merchandiser At Smi Furniture.docInternship Report Steps To Become A Merchandiser At Smi Furniture.doc
Internship Report Steps To Become A Merchandiser At Smi Furniture.doc
 
Giải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA gi...
Giải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA gi...Giải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA gi...
Giải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA gi...
 
Giải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA.doc
Giải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA.docGiải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA.doc
Giải pháp nâng cao công tác tuyển dụng nhân sự tại Công ty SUNG GWANG VINA.doc
 

More from Nhận Viết Đề Tài Trọn Gói ZALO 0932091562

Khảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.doc
Khảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.docKhảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.doc
Khảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.docNhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...
Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...
Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...Nhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....
Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....
Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....Nhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....
Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....
Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....Nhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...
Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...
Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...Nhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...
Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...
Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...Nhận Viết Đề Tài Trọn Gói ZALO 0932091562
 
Nghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docx
Nghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docxNghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docx
Nghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docxNhận Viết Đề Tài Trọn Gói ZALO 0932091562
 

More from Nhận Viết Đề Tài Trọn Gói ZALO 0932091562 (20)

InternSHIP Report Improving customer service in Military commercial join stoc...
InternSHIP Report Improving customer service in Military commercial join stoc...InternSHIP Report Improving customer service in Military commercial join stoc...
InternSHIP Report Improving customer service in Military commercial join stoc...
 
Dự Án Kinh Doanh Chuỗi Siêu Thị Thực Phẩm Sạch Kiên Nguyễn.docx
Dự Án Kinh Doanh Chuỗi Siêu Thị Thực Phẩm Sạch Kiên Nguyễn.docxDự Án Kinh Doanh Chuỗi Siêu Thị Thực Phẩm Sạch Kiên Nguyễn.docx
Dự Án Kinh Doanh Chuỗi Siêu Thị Thực Phẩm Sạch Kiên Nguyễn.docx
 
Tai kinh doanh dịch vụ thẻ thanh toán của Ngân hàng Tân Bình.docx
Tai kinh doanh dịch vụ thẻ thanh toán của Ngân hàng Tân Bình.docxTai kinh doanh dịch vụ thẻ thanh toán của Ngân hàng Tân Bình.docx
Tai kinh doanh dịch vụ thẻ thanh toán của Ngân hàng Tân Bình.docx
 
Planning Marketing For Water Gate Valves At Sao Nam Viet.docx
Planning Marketing For Water Gate Valves At Sao Nam Viet.docxPlanning Marketing For Water Gate Valves At Sao Nam Viet.docx
Planning Marketing For Water Gate Valves At Sao Nam Viet.docx
 
Khảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.doc
Khảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.docKhảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.doc
Khảo sát việc tuân thủ điều trị và kiến thức phòng biến chứng đái tháo đường.doc
 
Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...
Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...
Một Số Biện Pháp Phát Triển Ngôn Ngữ Cho Trẻ 5 – 6 Tuổi Trường Mẫu Giáo Minh ...
 
Kế Toán Vốn Bằng Tiền Tại Công Ty Tnhh Xây Dựng Và Hợp Tác Phúc Linh.docx
Kế Toán Vốn Bằng Tiền Tại Công Ty Tnhh Xây Dựng Và Hợp Tác Phúc Linh.docxKế Toán Vốn Bằng Tiền Tại Công Ty Tnhh Xây Dựng Và Hợp Tác Phúc Linh.docx
Kế Toán Vốn Bằng Tiền Tại Công Ty Tnhh Xây Dựng Và Hợp Tác Phúc Linh.docx
 
Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....
Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....
Các Nhân Tố Ảnh Hưởng Đến Cảm Nhận Chất Lượng Cho Vay Tại Ngân Hàng Agribank....
 
Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....
Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....
Đánh Giá Hoạt Động Digital Marketing Của Công Ty Tư Vấn Quảng Cáo Trực Tuyến....
 
Learning Of Specialized Vocabulary Of Thierd Year Students At Faculty Of Fore...
Learning Of Specialized Vocabulary Of Thierd Year Students At Faculty Of Fore...Learning Of Specialized Vocabulary Of Thierd Year Students At Faculty Of Fore...
Learning Of Specialized Vocabulary Of Thierd Year Students At Faculty Of Fore...
 
Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...
Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...
Đổi mới hoạch định chiến lược cạnh tranh của doanh nghiệp Viễn thông trong hộ...
 
Lập Dự Án Kinh Doanh Bàn Ghế Gỗ Tại Công Ty Tnhh Thái Minh Hưng.doc
Lập Dự Án Kinh Doanh Bàn Ghế Gỗ Tại Công Ty Tnhh Thái Minh Hưng.docLập Dự Án Kinh Doanh Bàn Ghế Gỗ Tại Công Ty Tnhh Thái Minh Hưng.doc
Lập Dự Án Kinh Doanh Bàn Ghế Gỗ Tại Công Ty Tnhh Thái Minh Hưng.doc
 
Challenges In Learning English Speaking Skills For Kids At Atlanta English Ce...
Challenges In Learning English Speaking Skills For Kids At Atlanta English Ce...Challenges In Learning English Speaking Skills For Kids At Atlanta English Ce...
Challenges In Learning English Speaking Skills For Kids At Atlanta English Ce...
 
Bài Tiểu Luận Dự Án Thành Lập Công Ty Tnhh Du Lịch Chữa Bệnh.docx
Bài Tiểu Luận Dự Án Thành Lập Công Ty Tnhh Du Lịch Chữa Bệnh.docxBài Tiểu Luận Dự Án Thành Lập Công Ty Tnhh Du Lịch Chữa Bệnh.docx
Bài Tiểu Luận Dự Án Thành Lập Công Ty Tnhh Du Lịch Chữa Bệnh.docx
 
Bài Báo Cáo Thực Tập Tại Công Ty Du Lịch Cattour.doc
Bài Báo Cáo Thực Tập Tại Công Ty Du Lịch Cattour.docBài Báo Cáo Thực Tập Tại Công Ty Du Lịch Cattour.doc
Bài Báo Cáo Thực Tập Tại Công Ty Du Lịch Cattour.doc
 
Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...
Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...
Địa vị pháp lý của công ty trách nhiệm hữu hạn hai thành viên trở lên theo lu...
 
Nghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docx
Nghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docxNghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docx
Nghiên Cứu Nhận Thức Của Người Tiêu Dùng Về Thực Phẩm Hữu Cơ Tại Siêu Thị.docx
 
Kế Hoạch Thành Lập Công Ty Tnhh Dịch Vụ Chuyển Phát Nhanh.docx
Kế Hoạch Thành Lập Công Ty Tnhh Dịch Vụ Chuyển Phát Nhanh.docxKế Hoạch Thành Lập Công Ty Tnhh Dịch Vụ Chuyển Phát Nhanh.docx
Kế Hoạch Thành Lập Công Ty Tnhh Dịch Vụ Chuyển Phát Nhanh.docx
 
Lập Kế Hoạch Kinh Doanh Công Ty Tnhh Du Lịch Phương Nam Đến Năm 2025.docx
Lập Kế Hoạch Kinh Doanh Công Ty Tnhh Du Lịch Phương Nam Đến Năm 2025.docxLập Kế Hoạch Kinh Doanh Công Ty Tnhh Du Lịch Phương Nam Đến Năm 2025.docx
Lập Kế Hoạch Kinh Doanh Công Ty Tnhh Du Lịch Phương Nam Đến Năm 2025.docx
 
Quản Lý Thu Ngân Sách Nhà Nước Từ Khu Vực Ngoài Quốc Doanh.docx
Quản Lý Thu Ngân Sách Nhà Nước Từ Khu Vực Ngoài Quốc Doanh.docxQuản Lý Thu Ngân Sách Nhà Nước Từ Khu Vực Ngoài Quốc Doanh.docx
Quản Lý Thu Ngân Sách Nhà Nước Từ Khu Vực Ngoài Quốc Doanh.docx
 

Recently uploaded

PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢIPHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢImyvh40253
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdfTrnHoa46
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...Nguyen Thanh Tu Collection
 
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgsNmmeomeo
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngYhoccongdong.com
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIĐiện Lạnh Bách Khoa Hà Nội
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...Nguyen Thanh Tu Collection
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...Nguyen Thanh Tu Collection
 
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...hoangtuansinh1
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfhoangtuansinh1
 
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptxNhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptxhoangvubaongoc112011
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfTrnHoa46
 
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...Nguyen Thanh Tu Collection
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanmyvh40253
 
Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................TrnHoa46
 

Recently uploaded (20)

PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢIPHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
PHƯƠNG THỨC VẬN TẢI ĐƯỜNG SẮT TRONG VẬN TẢI
 
sách sinh học đại cương - Textbook.pdf
sách sinh học đại cương   -   Textbook.pdfsách sinh học đại cương   -   Textbook.pdf
sách sinh học đại cương - Textbook.pdf
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI LÝ LUẬN VĂN HỌC NĂM HỌC 2023-2024 - MÔN NGỮ ...
 
1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf
1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf
1 - MÃ LỖI SỬA CHỮA BOARD MẠCH BẾP TỪ.pdf
 
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgspowerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
powerpoint mẫu họp phụ huynh cuối kì 2 học sinh lớp 7 bgs
 
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng ĐồngGiới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
Giới thiệu Dự án Sản Phụ Khoa - Y Học Cộng Đồng
 
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘIGIÁO TRÌNH  KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
GIÁO TRÌNH KHỐI NGUỒN CÁC LOẠI - ĐIỆN LẠNH BÁCH KHOA HÀ NỘI
 
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
TÀI LIỆU BỒI DƯỠNG HỌC SINH GIỎI KỸ NĂNG VIẾT ĐOẠN VĂN NGHỊ LUẬN XÃ HỘI 200 C...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
SÁNG KIẾN ÁP DỤNG CLT (COMMUNICATIVE LANGUAGE TEACHING) VÀO QUÁ TRÌNH DẠY - H...
 
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
30 ĐỀ PHÁT TRIỂN THEO CẤU TRÚC ĐỀ MINH HỌA BGD NGÀY 22-3-2024 KỲ THI TỐT NGHI...
 
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
Danh sách sinh viên tốt nghiệp Đại học - Cao đẳng Trường Đại học Phú Yên năm ...
 
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdfChuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
Chuong trinh dao tao Su pham Khoa hoc tu nhien, ma nganh - 7140247.pdf
 
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptxNhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
Nhiễm khuẩn tiêu hóa-Tiêu chảy do vi khuẩn.pptx
 
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdfCampbell _2011_ - Sinh học - Tế bào - Ref.pdf
Campbell _2011_ - Sinh học - Tế bào - Ref.pdf
 
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
ĐỀ CHÍNH THỨC KỲ THI TUYỂN SINH VÀO LỚP 10 THPT CÁC TỈNH THÀNH NĂM HỌC 2020 –...
 
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quanGNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
GNHH và KBHQ - giao nhận hàng hoá và khai báo hải quan
 
Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................Đề cương môn giải phẫu......................
Đề cương môn giải phẫu......................
 

Internship Report Faculty Of Foreign Languages Đại Học Đại Nam.docx

  • 1. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 1 DAI NAM UNIVERSITY FACULTY OF FOREIGN LANGUAGES GRADUATION INTERNSHIP REPORT Location: DAI NAM UNIVERSITY Student: Lam Thi Hoa Mi Class: TAVB2 12-02 Student code: 1267010023 Supervisor: Pham Thi Bich Ngoc (M.A.) HANOI – August, 2020
  • 2. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 2 ACKNOWLEDGMENT In the process of completing this graduation paper, I have received a great deal of help, guidance and encouragement from my teachers and my colleagues. Firstly, I feel very grateful to Ms. Pham Thi Bich Ngoc, my supervisor, who helped me a lot during this internship. We have regularly exchanged emails with each other to get the best job done. I would like to express my sincere thanks to her, who has always been by my side and helped me during the reporting period. Besides, I would also like to thank the teachers of the Faculty of Foreign Languages for supporting the teaching in the past years, equipping me with the foundation knowledge to complete the graduation lesson. Finally, I would like to thank my family, friends, and colleagues for their constant support and encouragement for me to complete this article
  • 3. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 3 TABLE OF CONTENTS 1. INTRODUCTION....................................................................................................4 1.2. Expectations of the internship: .........................................................................4 1.3. Duration of the internship:................................................................................4 1.4. Field of the internship:......................................................................................4 1.5. Reason to choose the topic: ..............................................................................4 2. THEORY OF TRANSLATION ..............................................................................4 2.1.Definition of translation....................................................................................4 2.2.Translation methods..........................................................................................5 2.2.1. Word-for-word translation ....................................................................5 2.2.2. Literal translation ..................................................................................5 2.2.3. Faithful translation ................................................................................5 2.2.4. Semantic translation ..............................................................................5 2.2.5. Adaptation .............................................................................................6 2.2.6. Free translation......................................................................................6 2.2.7. Idiomatic translation..............................................................................6 2.2.8. Communicative translation ...................................................................7 2.2.9. Gist Translation.....................................................................................7 3. TRANSLATION PRACTICE .................................................................................8 3.1.Vietnamese - English Translation.....................................................................8 3.2.English - Vietnamese Translation...................................................................15 4. CONCLUSION......................................................................................................25 4.1.The achievements ...........................................................................................25 4.2.The existences.................................................................................................25 5. REFERENCES.......................................................................................................25 6. SUPERVISOR’S REMARKS ...............................................................................25 APPENDIX ...................................................................................................................27
  • 4. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 4 INTERNSHIP REPORT 1. INTRODUCTION 1.1. Purposes of the internship Graduation internship is a compulsory task of every university curriculum. It is a valuable opportunity for students to get access to reality. With this opportunity, I want to fulfill my goals and expectations. While studying at the Foreign Language Department of Dai Nam University, I had the opportunity to be exposed to a professional English environment, so I have accumulated a lot of English knowledge and developed many skills. Of the courses, translation is useful for my own specialization, which is Information Technology. Thanks to this translation skill, the scientific articles that I do on with my team have been translated as good as possible. Therefore, this internship report is not only my mission but also a good opportunity for me to review all of the translation knowledge that I have learned so far. In this internship report, I focus only on the translation section and give some translation methods in each sentence. 1.2. Expectations of the internship: My expectations of the internship are: practice more in language skills; improve writing and discussion skills; improve reading skills; create a foundation for learning and scientific research on information ; and contribute to the education cause of the locality as well as of Vietnam. 1.3. Duration of the internship: From 20/07/2020 to 05/09/2020 1.4. Field of the internship: Some translation techniques used in scientific articles. 1.5. Reason to choose the topic: Applying the translation methods again in this internship report helps me to apply the knowledge learned into practice; study and practice soft skills as well as improve teaching expertise; improve research, writing and document collection skills, etc. 2. THEORY OF TRANSLATION 2.1. Definition of translation
  • 5. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 5 Translation, by dictionary definition, consists of changing from one form to another, to turn into one’s own or another language. Some authors have given the following different definitions of translation: Translation is the replacement of textual material in one language (source language) by equivalent textual material in another language (target language). (JC Catford). Or, Translation is rendering the meaning of a text into another language in the way that the author intended the text. (Peter Newmark) 2.2. Translation methods There are nine types of translation: 2.2.1. Word-for-word translation This is often demonstrated as interlinear translation, with the target language immediately below the source language words. The source language word-order is preserved and the words translated singly by their most common out of context. 2.2.2. Literal translation The source language grammatical constructions are converted to their nearest target language equivalents but the lexical words are again translated singly, out of context. As a pretranslation process, this indicates the problems to be solved. For example: He is a big liar  Anh ta là một kẻ nói dối lớn. 2.2.3. Faithful translation A faithful translation attempts to reproduce the precise contextual meaning of the original within the constraints of the target language grammatical structures. It ‘transfers’ cultural words and preserves the degree of grammatical and lexical ‘abnormality’ (deviation from source language norms) in the translation. For example: He is as fast as a kangaroo  Gã nhanh như một con kanguru. 2.2.4. Semantic translation Semantic translation differs ‘faithful translation’ only in as far as it must take more account of the aesthetic value (that is, the beautiful and natural sound)
  • 6. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 6 of the source language text, compromising on ‘meaning’ where appropriate so that no assonance, word-play or repetition jars in the finished version. Further, it may translate less important cultural words by culturally neutral third or functional terms but not by cultural equivalents. The distinction between ‘faithful’ and ‘semantic’ translation is that the first is uncompromising and dogmatic, while the second is more flexible, admits the creative exception to 100% fidelity, and allows for the translator’s intuitive empathy with the original. For example: Right in the heart of Hanoi, Hoan Kiem Lake is an enchanting body of water, a peaceful oasis away from all the hustle and bustle of the city.  Nằm ngay giữa trái tim Hà Nội, hồ Hoàn Kiếm là một hồ nước đẹp mê hồn, một ốc đảo yên bình tách biệt với tất cả những gì ồn ào tấp nập của thành phố. 2.2.5. Adaptation This is the ‘freest’ form of translation. It is used mainly for plays (comedies) and poetry: the themes, characters, plots are usually preserved, the source language culture converted to the target language culture and the text rewritten by an established dramatist or poet. 2.2.6. Free translation Free translation reproduces the matter without the manner, or the content without the form of the original. Usually, it is a paraphrase much longer than the original, a so-called ‘intralingual translation’. For example: Heartease (pansy) is used again for healing the heart. It is for disappointment in love, and in separation. Hoa păng-xê cũng được dùng để chữa lành các vết thương lòng. Nó xoa diụ sự thất vọng trong tình yêu, và cả nỗi đau phải sống trong cảnh li thân. 2.2.7. Idiomatic translation Idiomatic translation reproduces the ‘message’ of the original but tends to distort nuances of meaning by preferring colloquialisms and idioms where these do not exist in the original. For example:
  • 7. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 7 Không ai nghe lời khuyên của cô ấy.  Her advice fell on deaf ears. 2.2.8. Communicative translation Communicative translation attempts to render the exact contextual meaning of the original in such a way that both content and language are readily acceptable and comprehensible to the readership. For example: Right in the heart of Hanoi, Hoan Kiem Lake is an enchanting body of water, a peaceful oasis away from all the hustle and bustle of the city.  Hồ Hoàn Kiếm là một hồ nước đẹp, yên tĩnh nằm ở trung tâm Hà Nội ồn ào. 2.2.9. Gist Translation It is the freest type of translation. Gist translation is characterized by keeping the main idea/gist of a text, omitting all its supporting details and subsidiary arguments. Gist translation can be used in language learning situations to summarize a written text at a written test.
  • 8. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 8 3. TRANSLATION PRACTICE 3.1. Vietnamese - English Translation STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật 1. Khai thác luật kết hợp từ các tập mục hữu ích cao. Mining association rules from high utility itemsets Literal 2. Trong kinh doanh, các doanh nghiệp đều có chung một mong muốn là làm thế nào để tăng doanh thu hay lợi nhuận. In business, businesses all have the same desire which is how to increase revenue or profit. Literal 3. Ví dụ, các siêu thị thường phân tích hoạt động kinh doanh của mình để xem xét sản phẩm nào mang lại lợi nhuận cao cho siêu thị. For example, supermarkets often analyze their business to find which products bring high profits to them. Faithful 4. Để thực hiện được việc này, cần khai thác tập hữu ích cao. To do this, it is necessary to exploit the high utility itemsets. Literal 5. Gần đây có nhiều công trình quan tâm đến lĩnh vực này, nhưng các công trình trên tốn nhiều thời gian và bộ nhớ sử dụng trong quá trình khai thác. Recently, there are many studies interested in this field, but the above works take a lot of time and memory usage in the mining process. Literal 6. Trong công trình này, nhóm tác giả đề xuất một thuật toán giúp tiết kiệm được thời gian và bộ nhớ trong quá trình khai thác. In this work, the authors propose an algorithm to reduce time and memory in the mining process. Literal 7. Khai thác dữ liệu là một quá trình quan trọng trong khám phá tri thức, nó là quá trình mô tả và dự đoán dựa trên các thông tin, tri thức, dữ liệu đã được lưu trữ, và phân tích các dữ liệu để tìm ra các dạng thức hoặc kết hợp có tính lặp đi lặp lại và tạo thành qui luật, các qui luật này hỗ trợ trong việc ra quyết định trong các lĩnh vực như: khoa học, giáo dục, kinh doanh, v.v... Data mining is an important process in knowledge discovery, it is the process of describing and predicting based on stored information, knowledge, data, and analyzing data to exploit. patterns or combinations that are repetitive and form rules which aid in decision making in areas such as science, education, business, etc. Faithful
  • 9. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 9 STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật 8. Khai thác dữ liệu còn là quá trình phát hiện các mô hình, các tổng kết khác nhau và các giá trị được lấy từ tập dữ liệu cho trước. Data mining is also the discovering different models, summaries and values taken from a given database. Literal 9. Khai thác tập mục hữu ích cao là bài toán mở rộng và tổng quát của khái thác tập phổ biến. Exploiting high utility itemsets is an extensive and general problem of frequent itemset mining. Literal 10. Trong khai thác tập mục hữu ích cao, giá trị của item trong giao dịch được quan tâm nhiều nhất (như số lượng đã bán của mặt hàng), ngoài ra còn có bảng lợi ích cho biết lợi ích mang lại khi bán một đơn vị hàng đó. In the mining HUIs, the value of the item is the most interest in the transaction (such as the quantity sold of the item), besides, there is also a profit table indicating the profit of selling a product/item unit. Faithful 11. Lợi ích của một itemset là số đo lợi nhuận của itemset đó đóng góp trong cơ sở dữ liệu, nó có thể là tổng lợi nhuận hay tổng chi phí của itemset. The profit of an itemset is sum of its profit in database, and it can be the total profit or the total cost of the itemset. Literal 12. Khai thác tập mục hữu ích cao là khám phá ra tất cả các tập mục có lợi ích không nhỏ hơn ngưỡng phổ biến tối thiểu do người dùng qui định. Exploiting HUIs is to discover all of the itemsets whose utilities are not less than the minimum utility threshold specified-user. Faithful 13. Mục đích chính của các bài toán khai thác tập mục hữu ích cao là làm giảm thiểu kích thước của tập ứng viên và làm đơn giản hóa quá trình tính toán độ hữu ích các tập mục. The main purpose of the problem of exploiting HUI is to minimize the size of the candidate set and to simplify their utilities computation. Literal 14. Cách tiếp cận đơn giản nhất cho bài toán khai thác tập mục hữu ích cao là liệt kê tất cả các tập mục từ cơ sở dữ liệu giao dịch theo nguyên lý vét cạn. The simplest approach to the HUI mining problem is to list all the itemsets from the transaction database according to the exhausting principle. Literal 15. Do đó, làm thế nào để tỉa bớt không gian tìm kiếm và Therefore, how to prune the search space and Literal
  • 10. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 10 STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật tìm đủ tất cả tập mục hữu ích cao một cách hiệu quả là một thách thức lớn trong khai thác tính hữu ích. extract full of HUIs effectively is a major challenge in utility mining. 16. Bài toán khai thác luật kết hợp từ các mẫu hữu ích cao còn khá mới. Sahoo và các đồng sự đã khởi đầu nghiên cứu và đề xuất thuật toán khai thác luật kết hợp hữu ích cao vào năm 2015. The problem of exploiting association rules from highly useful patterns is quite new. Sahoo and colleagues started researching and proposing a highly useful association law mining algorithm in 2015 Faithful 17. Phát biểu bài toán: Cho một cơ sở dữ liệu giao dịch D, ngưỡng độ hữu ích tối thiểu minutil và ngưỡng độ tin cậy hữu ích tối thiểu min-uconf, bài toán khai thác luật kết hợp hữu ích cao từ cơ sở dữ liệu D là tìm tất cả các luật có độ hữu ích lớn hơn hoặc bằng độ hữu ích tối thiểu minutil và có độ tin cậy hữu ích lớn hơn hoặc bằng độ tin cậy hữu ích tối thiểu. Problem statement: For a transaction database D, the minutil minimum useful threshold and the minuconf minimum useful confidence threshold, the problem of exploiting highly useful association rules from the database D is to find all the rules that have a minutil usefulness or greater than or equal to a minimum usefulness. Literal 18. Các thuật toán đề xuất được cài đặt và thực nghiệm trên môi trường có cấu hình như sau: Intel Core I7- 7500U 2.5 GHz, Ram 16 GB, hệ điều hành Windows 10, phiên bản 64 bit. The exported algorithms are installed and tested on the environment with the following configuration: Intel Core I7-7500U 2.5 GHz, 16 GB RAM, Windows 10 operating system, 64 bits version. export 19. Các cơ sở dữ liệu dùng cho thực nghiệm là các cơ sở dữ liệu chuẩn được tải từ website mã nguồn mở SPMF phát triển bởi Philippe. The experimental databases were the standard ones downloaded from the open source SPMF website developed by Philippe. Faithful 20. Thuật toán FHIM được đề xuất bởi Sahoo và các đồng sự được dùng để khai thác các tập mục hữu ích cao từ các cơ sở dữ liệu được đề cập ở trên. The FHIM algorithm proposed by Sahoo et al. is used to exploit HUIs from the databases mentioned above. Word-for-word
  • 11. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 11 STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật 21. Kết quả luật kết hợp hữu ích cao với độ tin cậy hữu ích tối thiểu 60% - 80% và các độ hữu ích tối thiểu tương ứng của từng cơ sở dữ liệu được liệt kê. Highly utility association rules with minimum confidence from 60% to 80% and corresponding minimum utility threshold of each database listed. Faithful 22. Thuật toán đề xuất LARM có thời gian thực thi tối ưu nhờ vào cải tiến không gian tìm kiếm thông qua việc áp dụng tính chất 1 đã đề cập ở trên The proposed algorithm LARM has an optimal execution time base on the improvement of the search space through the application of property 1 mentioned above. Faithful 23. Trong phần tiếp theo của thực nghiệm, các đồ thị so sánh về thời gian thực thi sử dụng giữa hai thuật toán LARM và HGB-HAR sẽ được trình bày dưới dạng đồ thị sử dụng tỉ lệ thang logarit của 10. In the next part of the experiment, graphs of the execution time between the LARM and HGB-HAR will be presented with the logarithmic scale of 10. Free 24. Trong nghiên cứu này, tác giả sử dụng mô hình độ tin cậy hữu ích và lý thuyết dàn để khai thác luật kết hợp hữu ích cao nhằm khai thác mối quan hệ giữa các tập mục hữu ích cao. In this study, the author uses the utility model and lattice theory to exploit the high utility association rule to find the relationship between the high utility itemsets Literal 25. Nghiên cứu này là nghiên cứu đầu tiên áp dụng lý thuyết về dàn trong khai thác luật kết hợp hữu ích cao. This is the first study which apply the lattice concept theory in highly utility association rule mining Faithful 26. Tác giả đã đề xuất thuật toán HUIL để xây dựng dàn gồm các tập mục hữu ích cao. The author proposed an algorithm HUIL to build a concept of lattice of HUIs. Faithful 27. Kết quả thực nghiệm trên một số cơ sở dữ liệu chuẩn cho thấy thuật toán đã đề xuất, LARM, có hiệu quả cao cả về thời gian thực thi và bộ nhớ sử dụng. Experimental results on standard databases show that the proposed algorithm, LARM, has better efficiency in both execution time and memory usage. Literal
  • 12. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 12 STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật 28. Tính hiệu quả của thuật toán sẽ đóng góp rất lớn trong các hệ thống dự báo và ra quyết định. The efficiency of the algorithm will make a huge contribution to prediction and decision-making systems. Literal 29. Nghiên cứu này có thể được ứng dụng hiệu quả trong sản xuất kinh doanh, lập kế hoạch kinh doanh cũng như cuộc sống dựa vào đặc điểm và tính chất ứng dụng luật ứng với mỗi luật trong tập luật. This research can be applied in production and business, business planning as well as life effectively base on each rule’s characteristics and property Literal 30. Kết quả từ các luật kết hợp hữu ích cao sẽ mang lại kết quả hữu ích cho lãnh đạo trong khi hoạch định kế hoạch sản xuất, kinh doanh trong thời gian sắp tới, điển hình như xem xét các tập mặt hàng kết hợp với nhau mang lại lợi nhuận cao trong hoạt động kinh doanh bán lẻ, hoặc để xuất các chương trình khuyến mãi nhằm mang lại hiệu quả kinh doanh cao nhất. High utility association rules will bring leaders helpful results in planning for production and business in the near future, typically as considering the combination of products to bring high profits in retail business or launching promotions to bring the best business performance. Faithful 31. Bộ Y tế xác định tập trung nguồn lực truy vết để phát hiện sớm người bệnh, hạn chế sự lây lan của virus SARS-CoV-2, đồng thời điều trị sớm, hạn chế những biến chứng do các bệnh lý nền hoặc do COVID-19, đó là hai mũi giáp công cần được thực hiện để hạn chế thấp nhất những tác động mà dịch gây ra. The Ministry of Health determined to focus all traceability resources to early detect patients, limit the spread of the SARS-CoV-2 virus and at the same time provide early treatment, limit complications caused by underlying diseases or issued by COVID- 19. These are two attacks that need to be done to minimize the effects the epidemic causes. Literal 32. Theo nhận định của Bộ Y tế, mặc dù chúng ta đang kiểm soát được tình hình dịch bệnh COVID-19 tại Đà Nẵng, Quảng Nam và một số địa phương khác, tuy nhiên tình hình dịch sẽ tiếp tục kéo dài và xuất hiện các chùm ca bệnh và ca bệnh tại cộng đồng. Although, according to the Ministry of Health, we are controlling the COVID-19 epidemic in Da Nang, Quang Nam, and some other localities, the epidemic situation will continue to prolong and there wil be many more cases in the community. Faithful
  • 13. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 13 STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật 33. Tại buổi giao ban trực tuyến về công tác phòng, chống dịch với lãnh đạo sở y tế các địa phương chiều 19/8, Quyền Bộ trưởng Y tế Nguyễn Thanh Long cho biết ổ dịch ở Quảng Nam, Quảng Ngãi và Đà Nẵng đang từng bước được kiểm soát. At the online on epidemic prevention and control with leaders of local health departments on August 19, Acting Health Minister Nguyen Thanh Long said that outbreaks in Quang Nam, Quang Ngai and Da Nang were being step by step controlled. Word-for-word 34. Số ca mắc giảm dần trong những ngày gần đây. The number of cases has been decreasing in recent days. Word-for-word 35. Từ bài học của Đà Nẵng, Quảng Nam và Hải Dương, Quyền Bộ trưởng cho rằng vấn đề đặt ra là các địa phương phải làm gì khi dịch bệnh xảy ra. Learning from Da Nang, Quang Nam and Hai Duong, the Acting Minister said that the problem is what localities must do when the epidemic occurs. Free 36. Thực tế, nhiều địa phương còn lúng túng trong cách xử lý. In fact, many localities are still confused in how to handle the epidemic. Free 37. Đó là lý do Bộ Y tế phải thường xuyên điều chuyên gia trung ương hỗ trợ các địa phương. That is the reason why the Ministry of Health has to regularly send central experts to assist localities. Literal 38. Ông Nguyễn Thanh Long cho hay chúng ta đang tìm mọi phương pháp để tiếp cận vaccine ngừa COVID- 19. Mr. Nguyen Thanh Long said we are looking for all methods to approach the COVID-19 vaccine. Word-for-word 39. Thời gian dự kiến sớm nhất là 6 tháng cuối năm 2021 vaccine có thể đến với người dân. The earliest expected time is the last 6 months of 2021, the vaccine against covid-19 can be distributed to the people. Faithful 40. Người dân cần sẵn sàng chiến đấu với dịch. People need to be ready mentally to fight the epidemic. Word-for-word
  • 14. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 14 STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật 41. Các địa phương phải chuẩn bị cho tâm thế dịch sẽ kéo dài, nếu không có vaccine, cuộc chiến chống dịch rất khó khăn. The localities must prepare for the epidemic that will last long. Without vaccines, the fight against the epidemic will face many difficulties. Faithful 42. Quyền Bộ trưởng Nguyễn Thanh Long cũng đề nghị các địa phương chủ động chống dịch theo phương châm 4 tại chỗ. Acting Minister Nguyen Thanh Long also suggested that localities should actively fight against the epidemic under the motto 4 in place. Word-for-word 43. Ngoài ra, các địa phương cần chủ động mua sắm trang thiết bị, sinh phẩm và thực hiện sàng lọc theo đúng quy định để được bảo hiểm y tế thanh toán. In addition, localities need to actively purchase equipment and biological products, and perform screening in accordance with regulations to be paid by health insurance. Faithful 44. Tuy nhiên, việc sàng lọc trong cộng đồng sẽ không được thanh toán. However, community screening will not be covered by insurance. Literal 45. Về vấn đề trang thiết bị phòng hộ cho chống dịch, các tỉnh, thành phải đảm bảo giường cấp cứu và nhân lực. On the issue of protective equipment for anti- epidemic diseases, provinces must ensure adequate emergency beds and human resources. Free 46. Theo Quyền Bộ trưởng Y tế, đến nay, cả nước có khoảng 150 ổ dịch. According to the Acting Minister of Health, up to now, Vietnam has about 150 outbreaks. Word-for-word 47. Ngành y tế đã có nhiều bài học trong phòng, chống dịch như chần chừ sẽ rất nguy hiểm, phải truy tìm, cách ly nhanh để đưa mầm bệnh ra khỏi cư dân, cộng đồng. The health sector has had many lessons in epidemic prevention and control such as delaying it will be very dangerous, quickly tracing and quarantining to bring pathogens out of residential areas. Faithful
  • 15. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 15 STT Bản gốc Bản dịch Phương pháp/ Kỹ thuật 48. Nhận định công tác giám sát rất quan trọng, lãnh đạo Bộ Y tế đã yêu cầu các nhà thuốc phải giám sát chặt các trường hợp mua thuốc nghi ngờ như ốm, ho, sốt,... nếu không báo cho cơ sở y tế thì yêu cầu xử lý nghiêm. Recognizing that surveillance is very important, the Ministry of Health has asked pharmacies to closely monitor all drug purchases with symptoms such as illness, cough, and fever. If they do not notify the medical facility, they will be strictly punished. Literal 49. Đối với các bệnh viện, nếu để tình trạng bệnh nhân nghi ngờ “lọt” thì cũng sẽ bị xử lý nghiêm. For hospitals, if the patient's condition is suspected of "passing", they will also be strictly dealt with. Free 50. Trong đợt dịch bùng phát mới đây, Đà Nẵng có số ca nhiễm SARS-CoV-2 cao nhất cả nước, tiếp theo là Quảng Nam. During the recent outbreak, Da Nang had the highest number of SARS-CoV-2 infections in the country, followed by Quang Nam. Faithful 3.2. English - Vietnamese Translation No. Original Translation Translation Methods / Techniques 51. Frequent itemset mining (FIM) [1], [3], [8], [9], [18], [19], [20], [28], [29] is a fundamental research topic in data mining. Khai thác tập phổ biến (FIM) [1], [3], [8], [9], [18], [19], [20], [28], [29] là một chủ đề nghiên cứu cơ bản trong khai phá dữ liệu. Literal
  • 16. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 16 No. Original Translation Translation Methods / Techniques 52. However, the traditional FIM may discover a large amount of frequent but low-value itemsets and lose the information on valuable itemsets having low selling frequencies. Tuy nhiên, FIM truyền thống có thể phát hiện ra một lượng lớn các tập phổ biến nhưng có giá trị thấp và mất thông tin về các tập mà có tần số bán hàng thấp. Faithful 53. Hence, it cannot satisfy the requirement of users who desire to discover itemsets with high utilities such as high profits. Do đó, thuật toán này không thể đáp ứng được yêu cầu của người dùng đó là mong muốn khám phá những tập sản phẩm có lợi nhuận cao. Faithful 54. To address these issues, utility mining [2], [4], [7], [10], [11], [12], [13], [14], [15], [16], [17], [18], [22], [23], [25], [26], [27], [29], [34], [35], [36] emerges as an important topic in data mining and has received extensive attention in recent years. Để giải quyết những vấn đề này, khai thác độ hữu ích [2], [4], [7], [10], [11], [12], [13], [14], [15], [16], [17] , [18], [22], [23], [25], [26], [27], [29], [34], [35], [36] nổi lên như một chủ đề quan trọng trong khai thác dữ liệu và trong những năm gần đây, chủ đề này đã nhận được sự quan tâm rộng rãi. Literal 55. In utility mining, each item is associated with a utility (e.g. unit profit) and an occurrence count in each transaction (e.g. quantity). Trong khai thác độ hữu ích, mỗi mục được liên kết với một độ hữu ích (ví dụ: lợi nhuận của một đơn vị sản phẩm) và số lần xuất hiện trong mỗi giao dịch (ví dụ: số lượng bán hàng). Literal 56. The utility of an itemset represents its importance, which can be measured in terms of weight, value, quantity or other information depending on the user specification Độ hữu ích của một tập mục thể hiện tầm quan trọng của nó, có thể được đo lường về trọng lượng, giá trị, số lượng hoặc các thông tin khác tùy thuộc vào sự lựa chọn của người Literal
  • 17. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 17 No. Original Translation Translation Methods / Techniques dùng 57. An itemset is called high utility itemset (HUI) if its utility is no less than a user-specified minimum utility threshold min_util. Một tập được gọi là tập hữu ích cao (HUI) nếu độ hữu ích của nó không nhỏ hơn ngưỡng hữu ích tối thiểu do người dùng chỉ định min_util. Literal 58. HUI mining is essential to many applications such as streaming analysis [2], [11], [35], market analysis [13], [17], [22], mobile computing [23] and biomedicine [4]. Khai thác HUI rất cần thiết cho nhiều ứng dụng như phân tích luồng dữ liệu [2], [11], [35], phân tích thị trường [13], [17], [22], điện toán di động [23] và y sinh học [4]. Literal 59. However, efficiently mining HUIs in databases is not an easy task because the downward closure property [1], [8] used in FIM does not hold for the utility of itemsets Tuy nhiên, việc khai thác HUI hiệu quả không phải là một nhiệm vụ dễ dàng vì thuộc tính bao đóng giảm [1], [8] sử dụng trong FIM không áp dụng được trong độ hữu ích của tập mục. Faithful 60. In other words, pruning search space for HUI mining is difficult because a superset of a low utility itemset can be high utility. Nói cách khác, việc cắt tỉa không gian tìm kiếm trong khai thác HUI là rất khó bởi vì một tập cha của một tập có độ hữu ích thấp có thể là một tập hữu ích. Literal 61. To tackle this problem, the concept of transaction weighted utilization (TWU) model [13] was introduced to facilitate the performance of the mining task. Để giải quyết vấn đề này, khái niệm về mô hình sử dụng trọng số giao dịch (TWU) [13] đã được đưa ra để nâng cao nhiệm vụ khai thác dữ liệu. Free
  • 18. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 18 No. Original Translation Translation Methods / Techniques 62. In this model, an itemset is called high transaction-weighted utilization itemset (HTWUI) if its TWU is no less than min_util, where the TWU of an itemset represents an upper bound on its utility. Trong mô hình này, một tập được gọi là tập có trọng số giao dịch cao (HTWUI) nếu TWU của nó không nhỏ hơn min_util, trong đó TWU của một tập là cận trên về độ hữu ích của nó. Faithful 63. Therefore, a HUI must be a HTWUI and all the HUIs must be included in the complete set of HTWUIs. Do đó, HUI phải là HTWUI và tất cả các HUI phải được bao gồm trong bộ HTWUI hoàn chỉnh Word-for-word 64. A classical TWU model-based algorithm consists of two phases. Một thuật toán dựa trên mô hình TWU cổ điển bao gồm hai giai đoạn. Faithful 65. In the first phase, called phase I, the complete set of HTWUIs are found. Trong giai đoạn đầu, được gọi là giai đoạn I, sẽ xác định đây đủ tập HTWUIs. Literal 66. In the second phase, called phase II, all HUIs are obtained by calculating the exact utilities of HTWUIs with one database scan. Trong giai đoạn thứ hai,, tất cả các HUI được xác định bằng cách tính chính xác độ hữu ích của HTWUI với một lần quét cơ sở dữ liệu. Free 67. Although many studies have been devoted to HUI mining, it is difficult for users to choose an appropriate minimum utility threshold in practice. Mặc dù nhiều nghiên cứu về khai thác HUI, trong thực tế, người dùng rất khó để chọn một ngưỡng độ hữu ích thiểu thích hợp. Faithful 68. Depending on the threshold, the output size can be very small or very large. Tùy thuộc vào ngưỡng, kích thước kết quả có thể rất nhỏ hoặc rất lớn. Free
  • 19. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 19 No. Original Translation Translation Methods / Techniques 69. Besides, the choice of the threshold greatly influences the performance of the algorithms. Bên cạnh đó, việc lựa chọn ngưỡng ảnh hưởng lớn đến hiệu suất thực thi của các thuật toán. Literal 70. If the threshold is set too low, too many HUIs will be presented to the users and it is difficult for the users to comprehend the results. Nếu ngưỡng được chọn quá thấp, quá nhiều HUIs sẽ được phát hiện do đó cho người dùng khó mà hiểu được kết quả thu được. Faithful 71. A large number of HUIs also causes the mining algorithms to become inefficient or even run out of memory, because the more HUIs the algorithms generate, the more resources they consume. Số lượng HUI lớn cũng làm cho thuật toán khai thác trở nên kém hiệu quả hoặc thậm chí hết bộ nhớ, vì các thuật toán tạo ra càng nhiều HUI thì chúng càng tiêu tốn tài nguyên càng nhiều. Faithful 72. On the contrary, if the threshold is set too high, no HUI will be found. Ngược lại, nếu ngưỡng được chọn quá cao, sẽ không có HUI nào được tìm thấy. Word-for-word 73. To find an appropriate value for the min_util threshold, users need to try different thresholds by guessing and re-executing the algorithms over and over until being satisfied with the results. Để tìm một giá trị thích hợp cho ngưỡng min_util, người dùng cần thử các ngưỡng khác nhau bằng cách đoán và thực hiện lại nhiều lần các thuật toán cho đến khi hài lòng với kết quả. Literal 74. This process is both inconvenient and time- consuming. Quá trình này vừa bất tiện vừa tốn thời gian Free
  • 20. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 20 No. Original Translation Translation Methods / Techniques 75. To precisely control the output size and discover the itemsets with the highest utilities without setting the thresholds, a promising solution is to redefine the task of mining HUIs as mining top-k high utility itemsets (top-k HUIs). Để kiểm soát chính xác kích thước đầu ra và khám phá các tập có độ hữu ích cao nhất mà không cần đặt ngưỡng, một giải pháp tiềm năng là xác định lại nhiệm vụ khai thác HUI như khai thác k tập có độ hữu ích lớn nhất thỏa ngưỡng Free 76. The idea is to let the users specify k, i.e., the number of desired itemsets, instead of specifying the minimum utility threshold. Ý tưởng là để cho người dùng chọn số k, tức là số lượng tập mục mong muốn, thay vì chỉ định ngưỡng độ hữu ích tối thiểu. Word-for-word 77. Setting k is more intuitive than setting the threshold because k represents the number of itemsets that the users want to find whereas choosing the threshold depends primarily on database characteristics, which are often unknown to users. Chọn k sẽ trực quan hơn chọn ngưỡng vì k là số lượng tập mà người dùng muốn tìm trong khi việc chọn ngưỡng phụ thuộc chủ yếu vào các đặc tính của cơ sở dữ liệu mà người dùng thường không biết. Literal 78. Using a parameter k instead of the min_util threshold is very desirable for many applications. Sử dụng tham số k thay cho ngưỡng min_util là nhu cầu đối với nhiều ứng dụng. Free 79. For example, to analyze customer purchase behavior, top-k HUI mining serves as a promising solution for users who desire to know: Ví dụ: để phân tích hành vi mua hàng của khách hàng, khai thác top-k HUI như một giải pháp đầy tiềm năng cho những người dùng muốn biết: Literal
  • 21. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 21 No. Original Translation Translation Methods / Techniques 80. “What are the top-k sets of products (i.e., itemsets) that contribute the highest profits to the company?” and “How to efficiently find these itemsets without setting the min_util threshold?” "K sản phẩm nào mang lại lợi nhuận cao nhất cho công ty?" và “Làm thế nào để xác định những bộ sản phẩm này mà không cần chọn ngưỡng min_util? ”. Free 81. Although top-k HUI mining is essential to many applications, developing efficient algorithms for mining such patterns is not an easy task. Mặc dù khai thác top-k HUI là điều cần thiết đối với nhiều ứng dụng, nhưng việc phát triển các thuật toán hiệu quả để khai thác các mẫu như vậy không phải là một nhiệm vụ dễ dàng. Faithful 82. It poses four major challenges as discussed below. Nó đặt ra bốn thách thức lớn sẽ được thảo luận dưới đây. Faithful 83. First, the utility of itemsets is neither monotone nor antimonotone [1], [8] Đầu tiên, độ hữu ích của các tập không đơn điệu cũng không phải là đơn nguyên[1], [8] Faithful 84. In other words, the utility of an itemset may be equal to, higher or lower than that of its supersets and subsets Nói cách khác, độ hữu ích của một tập có thể bằng, cao hơn hoặc thấp hơn độ hữu ích của tập con và tập cha của nó. Literal 85. Therefore, many techniques developed in top-k frequent pattern mining that rely on anti- monotonicity to prune the search space cannot be directly applied to top-k high utility itemset mining. Do đó, nhiều kỹ thuật được phát triển trong khai thác top-k mẫu phổ biến dựa trên tính đơn điệu để tỉa bớt không gian tìm kiếm không thể được áp dụng trực tiếp cho khai thác top-k tập hữu ích cao. Literal
  • 22. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 22 No. Original Translation Translation Methods / Techniques 86. The second challenge is how to incorporate the concept of top-k pattern mining with the TWU model Thách thức thứ hai là làm thế nào để kết hợp khái niệm khai thác mô hình top-k với mô hình TWU. Literal 87. Although the TWU model is widely used in utility mining, it is difficult to adapt this model to top-k HUI mining because the exact utilities of itemsets are unknown in phase I. Mặc dù mô hình TWU được sử dụng rộng rãi trong khai thác độ hữu ích, nhưng rất khó để điều chỉnh mô hình này sang khai thác top-k HUI vì độ hữu ích chính xác của các tập không được xác định trong giai đoạn I. Literal 88. When a HTWUI is generated in phase I, we cannot guarantee that its utility is higher than other HTWUIs and that it is a top-k HUI before performing phase II. Khi HTWUI được phát sinh giai đoạn I, chúng tôi không thể bảo đảm rằng độ hữu ích của nó cao hơn các HTWUI khác và đó là một top-k HUI trước khi thực thi giai đoạn II. Word-for-word 89. To guarantee that all the top-k HUIs can be captured in the set of HTWUIs, a naive approach is to run the algorithm with min_util = 0. Để đảm bảo rằng tất cả các top-k HUI được lưu trong HTWUI, một cách tiếp cận đơn giản là chạy thuật toán với min_util = 0. Literal 90. However, this approach may face the problem of a very large search space Tuy nhiên, cách tiếp cận này có thể gặp phải vấn đề về không gian tìm kiếm rất lớn. Literal 91. The third challenge is that the min_util threshold is not given in advance in top-k HUI mining. Thách thức thứ ba là ngưỡng min_util không được xác định trước trong khai thác top-k HUI. Literal
  • 23. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 23 No. Original Translation Translation Methods / Techniques 92. In traditional HUI mining, the search space can be efficiently pruned by the algorithms by using a given min_util threshold. Trong khai thác HUI truyền thống, các thuật toán sẽ cắt tỉa không gian tìm kiếm dựa vào ngưỡng min_util cho trước. Faithful 93. However, in the scenario of top-k HUI mining, no min_util threshold is provided in advance. Tuy nhiên, trong trường hợp khai thác top-k HUI, không có lợi thế ngưỡng min_util cho trước. Faithful 94. Therefore, the minimum utility threshold is initially set to 0 and the designed algorithm has to gradually raise the threshold to prune the search space. Do đó, ngưỡng tiện ích tối thiểu ban đầu được xác định là 0 và thuật toán được thiết kế phải nâng dần ngưỡng để cắt tỉa không gian tìm kiếm. Literal 95. Such a threshold is an internal parameter of the designed algorithm and is called the border minimum utility threshold min_utilBorder in this paper Giống như ngưỡng là một tham số bên trong của thuật toán được thiết kế và được gọi là ngưỡng hữu ích tối biên thiểu và trong bài báo sẽ ký hiệu là min_utilBorder. Free 96. It is different from the external parameter min_util that is given by users in advance Nó khác với tham số min_util do người dùng cung cấp trước. Faithful 97. If an algorithm cannot raise the min_utilBorder threshold effectively and efficiently, it would produce too many intermediate low utility itemsets during the mining process, which may degrade its performance in terms of execution time and memory usage. Nếu một thuật toán không thể tăng ngưỡng min_utilBorder một cách hiệu quả, thuật toán sẽ tạo ra nhiều tập có độ hữu ích thấp trung gian làm cho hiệu suất của thuật toán kém cả về thời gian và bộ nhớ sử dụng. Faithful
  • 24. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 24 No. Original Translation Translation Methods / Techniques 98. Thus the challenge is to design effective strategies that can raise the min_util threshold as high as possible and as quickly as possible, and further reduce as much as possible the number of candidates and intermediate low utility itemsets produced in the mining process. Do đó, thách thức là thiết kế các chiến lược hiệu quả có thể nâng ngưỡng min_util lên cao nhất và nhanh nhất có thể, đồng thời thu gọn số lượng ứng viên và việc sinh ra các tập hữu ích thấp trong quá trình khai thác càng nhiều càng tốt. Literal 99. The last challenge is how to effectively raise the min_utilBorder threshold without missing any top-k HUIs Thách thức cuối cùng là làm thế nào để tăng ngưỡng min_utilBorder một cách hiệu quả mà không mất bất kỳ top-k HUI nào. Literal 100. A good algorithm is one that can effectively raise the threshold during the mining process. Một thuật toán tốt là thuật toán có thể tăng cao ngưỡng hiệu quả khi khai thác. Faithful
  • 25. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 25 4. CONCLUSION 4.1. The achievements I learned a lot from this internship report. Translation is not simple and easy. During this internship I had the opportunity to practice translation methods, using a number of translation methods to complete this report such as word for word, literal translation, faithful translation, communicative translation, and free translation. Thanks to this precious opportunity, I have had the opportunity to review a wide range of skills and knowledge serving my work, such as translation theory and writing skills. 4.2. The existences In addition to the things achieved, I also find myself lacking a number of shortcomings in the process of studying 2nd degree at Dai Nam University. First, there is no English communication environment, so I only develop two skills for myself: reading and writing. Second, I am constrained in documents specialized in information technology, so there are more or fewer shortcomings in other translation skills such as: semantic translation, idiomatic translation, adaptation translation, and gist translation. 5. REFERENCES [1] Ngọc Hướng, Tuấn Anh, Thu Hường, “Theory of Translation”, Khoa Ngoại ngữ, Đại học Đại Nam. [2] Nguyễn, T. T. L. (2018). Khai thác luật kết hợp từ các tập mục hữu ích cao. [3] Đỗ Thoa. (2020, ngày 21 tháng 8). Chủ động ứng phó với tình trạng dịch bệnh kéo dài. Truy xuất từ: http://dangcongsan.vn/khoa-giao/chu-dong-ung-pho-voi-tinh-trang-dich-benh- keo-dai-562004.html [4] Tseng, V. S., Wu, C. W., Fournier-Viger, P., & Philip, S. Y. (2015). Efficient algorithms for mining top-k high utility itemsets. IEEE Transactions on Knowledge and data engineering, 28(1), 54-67. 6. SUPERVISOR’S REMARKS ................................................................................................................................. ................................................................................................................................. .................................................................................................................................
  • 26. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Luanvanmaster.com – Cần Kham Thảo - Kết bạn Zalo/Tele : 0973.287.149 26 ................................................................................................................................. .................................................................................................................................
  • 27. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 APPENDIX [2] (1) Khai thác luật kết hợp từ các tập mục hữu ích cao Nguyễn Thị Thuý Loan1 , Mai Hoàng Thắng2 1 Đại học Nguyễn Tất Thành 2 Công Ty TNHH Harvey Nash Việt Nam nthithuyloan@gmail.com; mhthang.it@gmail.com Tóm tắt (2) Trong kinh doanh, các doanh nghiệp đều có chung một mong muốn là làm thế nào để tăng doanh thu hay lợi nhuận. (3) Ví dụ, các siêu thị thường phân tích hoạt động kinh doanh của mình để xem xét sản phẩm nào mang lại lợi nhuận cao cho siêu thị. (4) Để thực hiện được việc này, cần khai thác tập hữu ích cao. (5) Gần đây có nhiều công trình quan tâm đến lĩnh vực này, nhưng các công trình trên tốn nhiều thời gian và bộ nhớ sử dụng trong quá trình khai thác. (6) Trong công trình này, nhóm tác giả đề xuất một thuật toán giúp tiết kiệm được thời gian và bộ nhớ trong quá trình khai thác. ® 2018 Journal of Science and Technology - NTTU Từ khóa: Khai thác dữ liệu, tập hữu ích cao, luật kết hợp. 1. Giới thiệu (7) Khai thác dữ liệu (KTDL) là một quá trình quan trọng trong khám phá tri thức, nó là quá trình mô tả và dự đoán dựa trên các thông tin, tri thức, dữ liệu đã được lưu trữ, và phân tích các dữ liệu để tìm ra các dạng thức hoặc kết hợp có tính lặp đi lặp lại và tạo thành qui luật, các qui luật này hỗ trợ trong việc ra quyết định trong các lĩnh vực như: khoa học, giáo dục, kinh doanh, v.v... (8) KTDL còn là quá trình phát hiện các mô hình, các tổng kết khác nhau và các giá trị được lấy từ tập dữ liệu cho trước [1]. Phương pháp KTDL thường được chia thành hai nhóm chính như sau: (i) Kỹ thuật KTDL mô tả: có nhiệm vụ mô tả về các tính chất hoặc các đặc tính chung của dữ liệu string hiện có. Các kỹ thuật này bao gồm: Phân cụm (Clustering), tóm tắt (Summerization), trực quan hóa (Visualization), phân tích sự phát triển và độ lệch (Evolution and Deviation analyst), khai phá luật kết hợp (Association rules), … (ii) Kỹ thuật KTDL dự đoán: Có nhiệm vụ đưa ra các dự đoán dựa vào các suy diễn trên dữ liệu hiện thời. Các kỹ thuật này gồm có: Phân lớp (Classifacation), hồi quy (regession), …. Tuy nhiên, chỉ có một số phương pháp thông dụng nhất là: Phân cụm dữ liệu, phân lớp dữ liệu, phương pháp hồi quy, và khai phá luật kết hợp. (9) Khai thác tập mục hữu ích cao là bài toán mở rộng và tổng quát của khái thác tập phổ biến. (10) Trong khai thác tập mục hữu ích cao, giá trị của item trong giao dịch được quan tâm nhiều nhất (như số lượng đã bán của mặt hàng), ngoài ra còn có bảng lợi ích cho biết lợi ích mang lại khi bán một đơn vị hàng đó. (11) Lợi ích của một itemset là số đo lợi nhuận của itemset đó đóng góp trong CSDL, nó có thể là tổng lợi nhuận hay tổng chi phí của itemset. (12) Khai thác tập mục hữu ích cao là khám phá ra tất cả các tập mục có lợi ích không nhỏ hơn ngưỡng phổ biến tối thiểu do người dùng qui định. (13) Mục đích chính của các bài toán khai thác tập mục hữu ích cao là làm
  • 28. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 giảm thiểu kích thước của tập ứng viên và làm đơn giản hóa quá trình tính toán độ hữu ích các tập mục từ đó giảm số lượng ứng viên cho tập mục hữu ích cao, giảm thời gian khai thác. (14) Cách tiếp cận đơn giản nhất cho bài toán khai thác tập mục hữu ích cao là liệt kê tất cả các tập mục từ CSDL giao dịch theo nguyên lý vét cạn, cách tiếp cận này sẽ gặp phải vấn đề về thời gian, không gian khi tìm kiếm quá lớn và nhất là khi CSDL chứa nhiều giao dịch hoặc ngưỡng min-util đặt ra quá thấp. (15) Do đó, làm thế nào để tỉa bớt không gian tìm kiếm và tìm đủ tất cả tập mục hữu ích cao một cách hiệu quả là một thách thức lớn trong khai thác tính hữu ích. Phần còn lại của bài báo được tổ chức như sau: Phần 2 trình bày các nghiên cứu liên quan đến bài toán khai thác tập mục hữu ích cao, và khai thác luật kết hợp. Phần 3 trình bày thuật toán đóng góp bao gồm các định nghĩa liên quan và thuật toán đề xuất. Kết quả thực nghiệm được trình bày trong phần 4. Kết luận và hướng phát triển được trình bày trong phần 5. 2. Các công trình liên quan Khai thác luật kết hợp truyền thống [2] chủ yếu dựa vào mô hình độ tin cậy – độ hỗ trợ. Theo đó, tất cả item trong cơ sở dữ liệu (CSDL) được xem xét như nhau. Tuy nhiên, trong CSDL thực tế, mỗi item có trọng số riêng của nó. Do đó, có nhiều nghiên cứu liên quan đến mối quan hệ giữa trọng số của từng item với số lượng của nó. Khai thác tập mục hữu ích cao là một trong những chủ đề liên quan đến vấn đề này. Bài toán khai thác tập mục hữu ích cao giúp giải quyết vấn đề mà bài toán khai thác tập phổ biến không giải quyết được. Trong khai thác tập hữu ích cao (HUIM), các item có thể xuất hiện nhiều lần trong một giao dịch, mỗi item có một trong số (lợi nhuận, độ hữu ích…). Kết quả của khai thác tập mục hữu ích cao được ứng dụng để tìm ra itemsets trong cơ sở dữ liệu mang lại lợi nhuận cao. Có rất nhiều thuật toán liên quan đã được đề xuất. Điển hình, Liu và các đồng sự (2005) đề xuất thuật toán Two-Phase với các khái niệm về độ hữu ích của giao dịch – Transaction Utility (TU) và trọng số hữu ích của giao dịch – Transaction Weighted Utility (TWU) để cải tiến không gian tìm kiếm khai thác tập hữu ích cao [3]. Bởi vì TWU của tập mục hữu ích thỏa mãn tính bao đóng giảm, do đó hoàn toàn có thể dựa vào TWU và sửa đổi các thuật toán khai thác tập phổ biến để khai thác tập hữu ích cao. Vì vậy, tác giả đã sửa đổi thuật toán Apriori để khai thác tập hữu ích cao. Thuật toán Two-Phase bao gồm hai giai đoạn chính như sau. Giai đoạn 1: Tìm tất cả tập item có giá trị lợi ích lớn hơn giá trị ngưỡng do người dùng định nghĩa dựa trên trọng số hữu ích của giao dịch. Trong giai đoạn 1 chỉ có những kết hợp của những tập mục có trọng số giao dịch có độ hữu ích cao mới được thêm vào tập ứng viên trong suốt quá trình tìm kiếm thông minh trên mỗi mức. Tuy các tập item có độ lợi ích thấp có thể được đánh giá cao nhưng thuật toán lại không đánh giá thấp bất kỳ tập item nào.
  • 29. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Giai đoạn 2: Duyệt cơ sở dữ liệu để lọc ra các tập itemset có lợi ích cao từ tập lợi ích cao được tìm thấy trong giai đoạn 1. So với các thuật toán khai thác tập hữu ích cao hiện nay, thuật toán Two-Phase gặp vấn đề là một số lượng rất lớn các tập ứng viên được tạo ra nhưng hầu hết các ứng viên được sinh ra là có độ hữu ích không cao sau khi các giá trị hữu ích này được tính chính xác ở giai đoạn 2 của thuật toán. Ngoài ra, thuật toán thực hiện duyệt cơ sở dữ liệu nhiều lần sẽ gặp vấn đề về tốc độ xử lý nếu cơ sở dữ liệu có lượng giao dịch lớn. Để giải quyết các vấn đề liên quan đến việc có nhiều tập ứng viên được sinh ra làm giảm năng suất thực hiện của thuật toán Two-Phase. Tseng và các đồng sự đã đề xuất thuật toán UP-Growth vào năm 2010 [4]. Thuật toán UP-Growth gồm hai bước chính. Bước 1, xây dựng cấu trúc cây Up-Tree. Bước 2, xác định các tập mục hữu ích cao từ các tập mục hữu ích cao tiềm năng (PHUIs). Trong giai đoạn đầu, thuật toán duyệt cơ sở dữ liệu để tính toán TWU cho từng item. Sau đó, ở giai đoạn hai, thuật toán duyệt cơ sở dữ liệu và loại bỏ những item có giá trị TWU nhỏ hơn ngưỡng độ hữu ích tối thiểu min-util ra khỏi giao dịch tương ứng. Mặc dù hướng tiếp cận này của thuật toán UP-Growth sinh ra ít ứng viên hơn trong giai đoạn 1. Việc duyệt CSDL gốc vẫn rất tốn thời gian do CSDL gốc quá lớn và vẫn còn chứa nhiều mục không triển vọng Một cải tiến của thuật toán Up-Growth [4] được Tseng và các đồng sự đề xuất vào năm 2013 cũng nhằm mục đích khai thác các tập hữu ích cao, và được gọi tên là Up-Growth+ [5]. Thuật toán áp dụng các kỹ thuật cắt tỉa để rút gọn các tập các ứng viên. Sau khi tối ưu trên cây Up-Tree chúng ta sẽ có được tập các hữu ích cao tiềm năng (PHUIs) ít hơn so với Up-Growth. Thuật toán này được đánh giá là dễ cài đặt và có thời gian thực thi tốt hơn thuật toán Up-Growth vì chỉ thực hiện duyệt cơ sở dữ liệu hai lần. Liu và Qu đã đề xuất thuật toán HUI-Miner (High Utility Itemset Miner) [6] để khai thác thác tập hữu ích cao sử dụng một cấu trúc mới, được gọi là danh sách lợi ích, để lưu trữ tất cả các thông tin hữu ích về một tập và tìm ra thông tin để cắt tỉa không gian tìm kiếm. Thuật toán HUI-Miner [6] được xem là thuật toán tốt nhất để khai thác tập hữu ích cao cho đến khi có sự xuất hiện của thuật toán FHM [7], một thuật toán khai thác tập hữu ích cao được đề xuất bởi Phillipe và các đồng sự vào năm 2014. Khai thác luật kết hợp từ mẫu hữu ích cao (16) Bài toán khai thác luật kết hợp từ các mẫu hữu ích cao còn khá mới. Sahoo và các đồng sự đã khởi đầu nghiên cứu và đề xuất thuật toán khai thác luật kết hợp hữu ích cao [8] vào năm 2015. Thuật toán bao gồm ba giai đoạn chính, cụ thể như sau: Giai đoạn 1: Khai thác các tâp hữu ích cao đóng và các tập sinh. Giai đoạn 2: Thực thi thuật toán HGB để tìm ra tập luật căn bản (high utility generic basic – HGB). Tập HGB được định nghĩa như sau: 𝐻𝐺𝐵 = {𝑅: 𝑔 →h∖𝑔|h ∈𝐻𝑈𝐶𝐼 ∧ 𝑔 ∅, 𝑔⊂h, 𝑐𝑜𝑛𝑓(𝑅)≥𝑚𝑖𝑛−𝑢𝑐𝑜𝑛𝑓 ∧ ∄𝑔′ ⊂𝑔 ∧ 𝑐𝑜𝑛𝑓(𝑔′ → h ∖ 𝑔′) ≥ 𝑚𝑖𝑛 − 𝑢𝑐𝑜𝑛𝑓.
  • 30. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Trong giai đoạn 2 này, Giai đoạn 3: Thực thi thuật toán HAR để tìm ra tập kết quả tất cả các luật kết hợp hữu ích cao. Tên của thuật toán chung cho toàn bộ quá trình là HGB-HAR. Thuật toán HGB- HAR có khuyết điểm về mặt tính toán và tìm ra luật hợp lệ. Ngoài ra, luật sinh ra có thể bị trùng với luật đang có trong tập kết quả, do đó lãng phí thời gian tính toán. Vì vậy, thuật toán HGB-HAR chưa tối ưu về thời gian thực hiện. 3. Thuật toán đề xuất 3.1. Bài toán khai thác luật kết hợp hữu ích cao (17) Cho một cơ sở dữ liệu giao dịch D, ngưỡng độ hữu ích tối thiểu min-util và ngưỡng độ tin cậy hữu ích tối thiểu min-uconf, bài toán khai thác luật kết hợp hữu ích cao từ cơ sở dữ liệu D là tìm tất cả các luật có độ hữu ích lớn hơn hoặc bằng độ hữu ích tối thiểu min-util và có độ tin cậy hữu ích lớn hơn hoặc bằng độ tin cậy hữu ích tối thiểu. 3.2. Một số định nghĩa Định nghĩa 1. Cho một tập mục hữu hạn chứa các mục I =i1, i2, ..., im, mỗi item ip (1 ≤ p ≤ m) được gắn với một lợi nhuận cố định, được ký hiệu p(ip). Một tập mục X gồm k mục phân biệt i1, i2, ..., ik, trong đó ij I, 1 ≤ j≤ k, k số phần tử trong tập mục X. Một cơ sở dữ liệu giao dịch D = {T1, T2,...,Tn} gồm tập các giao dịch Td có một định danh id, được gọi là Tid. Mỗi item ip trong mỗi giao dịch Td được gắn kết với một trọng số được gọi là số lượng và được ký hiệu là q(ip, Td), tương ứng với item ip được mua. Định nghĩa 2. Độ hữu ích của một item i trong một giao dịch Td được ký hiệu là u(i, Tq) và được định nghĩa bằng công thức p(i) × q(i, Td). Định nghĩa 3. Độ hữu ích của một tập mục X trong giao dịch Td được ký hiệu là u(X,Td) và được xác định bởi công thức: 𝑢 ( 𝑋 , 𝑇𝑑 ) = ∑ 𝑥 𝑖 ∈ 𝑋 𝑢 ( 𝑥 𝑖 , 𝑇𝑑 ) . Định nghĩa 4. Độ hữu ích của một tập mục X trong cơ sở dữ liệu D được tính bằng tổng tất cả các độ hữu ích của X trong tất cả các giao dịch có chứa X. 𝑢(𝑋)=∑𝑋⊆𝑇𝑑 ⋀𝑇𝑑∈𝐷 𝑢(𝑋, 𝑇𝑑). Định nghĩa 5. Một tập mục X được xem là tập mục hữu ích cao (HUI) nếu X có độ hữu ích bằng hoặc lớn hơn giá trị hữu ích tối thiểu mà người dùng định nghĩa (min- util). Nếu tập mục X có độ hữu ích thấp hơn độ hữu ích tối thiểu thì X không phải là tập mục hữu ích cao, hay còn gọi là tập mục hữu ích thấp. Định nghĩa 6. Một tập mục Y được gọi là tập bao đóng của tập mục X nếu không có tập cha nào của X chứa Y và có supp(X) = supp(Y), ký hiệu là 𝛾(𝑋). X được gọi là tập hữu ích đóng nếu 𝑋 = 𝛾(𝑋) và u(X) ≥ min-util. Định nghĩa 7. Một tập mục X được gọi là tập sinh hữu ích cao (HUI Generator) nếu X là tập mục hữu ích cao và không có tập con Z nào của X sao cho supp(X) = supp(Z). Định nghĩa 8. Độ hữu ích cục bộ của một item xi trong tập mục X, ký hiệu 𝑙𝑢𝑣 (𝑥𝑖 , 𝑋)
  • 31. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 và được tính bằng tổng độ hữu ích của xi trong tất cả giao dịch có chứa X, được xác định bằng công thức sau: 𝑙𝑢𝑣(𝑥𝑖,𝑋)= ∑𝑋⊆𝑡𝑑 ⋀𝑡𝑑∈𝐷𝑢(𝑥𝑖,𝑡𝑑). Định nghĩa 9. Với X = x1, x2, ..., xnlà một tập mục n phần tử, mảng đơn vị độ hữu ích của X được ký hiệu U(X) = u1, u2, ..., un, trong đó 𝑢𝑖 = 𝑙𝑢𝑣 (𝑥𝑖, 𝑋), 𝑖 ∈ {1,2, ..., 𝑛}. Định nghĩa 10. Độ hữu ích cục bộ của tập mục X trong tập mục Y (𝑋 ⊆ 𝑌), ký hiệu là 𝑙𝑢𝑣 (𝑋, 𝑌) và được định nghĩa bằng tổng các độ hữu ích cục bộ của tất cả item 𝑥𝑖 ∈𝑋 trong Y. Công thức tính độ hữu ích cục bộ của tập mục X trong tập mục Y được biểu diễn như sau: 𝑙𝑢𝑣(𝑋,𝑌)= ∑𝑥𝑖∈𝑋⊆𝑌𝑙𝑢𝑣(𝑥𝑖,𝑌). Định nghĩa 11. Luật kết hợp hữu ích R là một hàm biểu diễn mối quan hệ giữa hai tập hữu ích cao X, Y ⊆ I, được biểu diễn dưới dạng 𝑋 → 𝑌. Độ tin cậy hữu ích của luật R, ký hiệu là uconf(R), được xác định bằng công thức: 𝑅:𝑋→𝑌được gọi là luật kết hợp hữu ích cao nếu giá trị của uconf(R) lớn hơn hoặc bằng độ tin cậy hữu ích tối thiểu (min- uconf) do người dung định nghĩa. Ngược lại, R được gọi là luật kết hợp hữu ích thấp. Tính chất 1. Cho 𝑅1: 𝑋 → 𝑌, 𝑅2: 𝑋 → 𝑍 (𝑌 ⊂ 𝑍) là hai luật kết hợp trong mô hình độ tin cậy – hữu ích (utility- confidence framework), nếu R1 không phải là luật kết hợp hữu ích cao, thì R2 cũng không phải là luật kết hợp hữu ích cao. Định nghĩa 12. Cho 𝑅1:𝑋1 → 𝑌1 và 𝑅2:𝑋2 → 𝑌2 là hai luật kết hợp hữu ích cao trong mô hình độ tin cậy – hữu ích. R2 được xác định là dư thừa so với R1 nếu 𝑋2 ⋃𝑌2 ⊆ 𝑋1 ⋃ 𝑌1, 𝑅1. 𝑢𝑡𝑖𝑙𝑖𝑡𝑦 ≥ 𝑅2. 𝑈𝑡𝑖𝑙𝑖𝑡𝑦 , 𝑠𝑢𝑝𝑝𝑜𝑟𝑡 (𝑅1) = 𝑠𝑢𝑝𝑝𝑜𝑟𝑡 (𝑅2) và 𝑋1 ⊆ 𝑋2, 𝑌2 ⊆ 𝑌1, trong đó 𝑅𝑖. 𝑢𝑡𝑖𝑙𝑖𝑡𝑦 là độ hữu ích của luật𝑅i,i=1,2, và độ hỗ trợ của luật R:𝑋→𝑌 là supp(𝑋⋃𝑌). 3.3 Thuật toán Thuật toán HUIL Đầu vào: Tập HUIs được sắp xếp theo thứ tự phần tử tăng dần (TableHUI) Đầu ra: dàn HUIL với nút gốc rootNode.
  • 32. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Thuật toán xây dựng dàn từ các HUIs được thực hiện như sau: Đầu tiên, thuật toán HUIL sẽ gọi hàm BuildLattice để xây dựng nút gốc cho dàn. Nút gốc là một nút rỗng không có chứa HUI, không có giá trị hữu ích và độ hỗ trợ. Tiếp theo, thuật toán duyệt qua tất cả các HUIs theo thứ tự sắp xếp số phần tử tăng dần. Khi xét mỗi HUI, thuật toán sẽ khởi tạo lại giá trị của cờ IsTraversed cho nút gốc và các nút con. Sau đó, thuật toán gọi hàm InsertLattice để thực hiện thêm HUI vào dàn. Trong hàm InsertLattice, cờ được sử dụng để xác định xem HUI đang xét {X} có thể được thêm trực tiếp vào nút đang xét hay không. Nếu nút đang xét rootNode có các nút con 𝑐h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 sao cho 𝑐h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 ⊂ 𝑋 (dòng 23), hàm InsertLattice sẽ được gọi đệ quy (dòng 25) để thêm nút {X} vào dàn. Nếu không có nút con childNode nào sao cho 𝑐h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 ∈ 𝑟𝑜𝑜𝑡𝑁𝑜𝑑𝑒. 𝐶h𝑖𝑙𝑑𝑟𝑒𝑛 và 𝐶h𝑖𝑙𝑑𝑁𝑜𝑑𝑒 ⊂ 𝑋, X sẽ là nút con trực tiếp của nút đang xét rootNode (dòng 29). 4. Thực nghiệm
  • 33. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 4.1. Môi trường thực nghiệm (18) Các thuật toán đề xuất được cài đặt và thực nghiệm trên môi trường có cấu hình như sau: Intel Core I7-7500U 2.5 GHz, Ram 16 GB, hệ điều hành Windows 10, phiên bản 64 bit. Công cụ dùng để phát triển thuật toán: Visual Studio 2015 Community, .Net framework 4.5, ngôn ngữ C#. 4.2. Cơ sở dữ liệu thực nghiệm (19) Các cơ sở dữ liệu dùng cho thực nghiệm là các cơ sở dữ liệu chuẩn được tải từ website mã nguồn mở SPMF phát triển bởi Philippe (http://www.philippe-fournier- viger.com/ spmf/ index.php?link=datasets.php). Các thuộc tính của cơ sở dữ liệu được mô tả trong Bảng 1. 4.3. Kết quả thực nghiệm (20) Thuật toán FHIM được đề xuất bởi Sahoo và các đồng sự [8] được dùng để khai thác các tập mục hữu ích cao từ các cơ sở dữ liệu được đề cập ở trên. Sau đó thuật toán được đề xuất sẽ được thực thi với các thông số đầu vào bao gồm các tập hữu ích cao, độ hữu ích tối thiểu min-util, độ tin cậy hữu ích tối thiểu min-uconf.
  • 34. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 (21) Kết quả luật kết hợp hữu ích cao với độ tin cậy hữu ích tối thiểu 60% - 80% và các độ hữu ích tối thiểu tương ứng của từng cơ sở dữ liệu được liệt kê trong Bảng 2. 4.4. So sánh về thời gian (22) Thuật toán đề xuất LARM có thời gian thực thi tối ưu nhờ vào cải tiến không gian tìm kiếm thông qua việc áp dụng tính chất 1 đã đề cập ở trên. Kết quả là số cặp itemset cần xét để hình thành luật giảm. (23) Trong phần tiếp theo của thực nghiệm, các đồ thị so sánh về thời gian thực thi sử dụng giữa hai thuật toán LARM và HGB-HAR sẽ được trình bày dưới dạng đồ thị sử dụng tỉ lệ thang logarit của 10. Một số ký hiệu cho các đường biểu diễn trên đồ thị cụ thể như sau. LARM: biểu diễn cho thời gian thực thi để khai thác luật kết hợp hữu ích cao, bao gồm thời gian xây dựng dàn và thời gian rút trích luật. HGB-HAR: biểu diễn cho thời gian thực thi của thuật toán HGB-HAR
  • 35. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 Kết quả từ Hình 2 đến Hình 5 có thể đánh giá được rằng thuật toán LARM là thuật toán có thời gian thực thi tối ưu. Bên cạnh đó, nếu không xét đến thời gian xây dựng dàn, thuật toán LARM sẽ sử dụng rất ít thời gian để tìm kết quả luật kết hợp hữu ích cao. Các kết quả thực nghiệm trên các CSDL đã chứng minh ưu thế của việc sử dụng dàn trong khai thác luật kết hợp, đặc biệt là luật kết hợp hữu ích cao. 5. Kết luận và hướng phát triển 5.1. Kết luận (24) Trong nghiên cứu này, tác giả sử dụng mô hình độ tin cậy hữu ích và lý thuyết dàn để khai thác luật kết hợp hữu ích cao nhằm khai thác mối quan hệ giữa các tập mục hữu ích cao. (25) Nghiên cứu này là nghiên cứu đầu tiên áp dụng lý thuyết về dàn trong khai thác luật kết hợp hữu ích cao. (26) Tác giả đã đề xuất thuật toán HUIL để xây dựng dàn gồm các tập mục hữu ích cao. (27) Kết quả thực nghiệm trên một số cơ sở dữ liệu chuẩn cho thấy thuật toán đã đề xuất, LARM, có hiệu quả cao cả về thời gian thực thi và bộ nhớ sử dụng. (28) Tính hiệu quả của thuật toán sẽ đóng góp rất lớn trong các hệ thống dự báo và ra quyết định. (29) Nghiên cứu này có thể được ứng dụng hiệu quả trong sản xuất kinh doanh, lập kế hoạch kinh doanh cũng như cuộc sống dựa vào đặc điểm và tính chất ứng dụng luật ứng với mỗi luật trong tập luật. (30) Kết quả từ các luật kết hợp hữu ích cao sẽ mang lại kết quả hữu ích cho lãnh đạo trong khi hoạch định kế hoạch sản xuất, kinh doanh trong thời gian sắp tới, điển hình như xem xét các tập mặt hàng kết hợp với nhau mang lại lợi nhuận cao trong hoạt động kinh doanh bán lẻ, hoặc để xuất các chương trình khuyến mãi nhằm mang lại hiệu quả kinh doanh cao nhất. 5.2. Hướng phát triển Bằng cách sử dụng thuật toán HUIL để xây dựng kiến trúc dàn các tập hữu ích cao, nghiên cứu này có thể mở rộng phát triển các thuật toán khai thác luật kết hợp hữu ích cao không dư thừa, ngoài ra, có thể phát triển thuật toán khai thác các tập đóng hữu ích cao (closed high utility itemsets) và tập sinh hữu ích cao (high utility generators). Bên cạnh đó, các độ đo thú vị [9], [10] có thể được nghiên cứu áp dụng vào các thuật toán
  • 36. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 đã đề xuất nhằm tăng thêm tính hiệu quả và khai thác thêm các thông tin hữu ích từ các cơ sở dữ liệu giao dịch. Lời cảm ơn Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và công nghệ NTTU trong đề tài mã số 2017.01.75. Mining association rules from high utility itemsets Nguyen Thi Thuy Loan1, Mai Hoang Thang2 1Nguyen Tat Thanh University 2NashTech Global Abstract Most companies focus on their profit growth within the business environment. For example, supermarkets often analyze sales activities to investigate which products bring the most revenue. In order to solve the problem, we need to mine high utility item sets. Recently, there have been many researches focus on this problem. However, these methods consume more time and memory usage. In this paper, we propose an algorithm for saving the mining time and memory usage during mining process. Key words Data mining, high utility itemsets, association rules.
  • 37. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 [3] Chủ động ứng phó với tình trạng dịch bệnh kéo dài (ĐCSVN) - (31) Bộ Y tế xác định tập trung nguồn lực truy vết để phát hiện sớm người bệnh, hạn chế sự lây lan của virus SARS-CoV-2, đồng thời điều trị sớm, hạn chế những biến chứng do các bệnh lý nền hoặc do COVID-19, đó là hai mũi giáp công cần được thực hiện để hạn chế thấp nhất những tác động mà dịch gây ra. Dịch sẽ tiếp tục kéo dài, xuất hiện các chùm ca bệnh và ca bệnh tại cộng đồng (32) Theo nhận định của Bộ Y tế, mặc dù chúng ta đang kiểm soát được tình hình dịch bệnh COVID-19 tại Đà Nẵng, Quảng Nam và một số địa phương khác, tuy nhiên tình hình dịch sẽ tiếp tục kéo dài và xuất hiện các chùm ca bệnh và ca bệnh tại cộng đồng, do đó các địa phương phải nâng mức cảnh giác ở mức cao nhất để phát hiện sớm và kịp thời cách ly, khoanh vùng, dập dịch để tránh dịch bệnh lây lan ra cộng đồng. Xét nghiệm virus SARS-CoV-2 tại Đà Nẵng. (Ảnh: Tuấn Dũng) (33) Tại buổi giao ban trực tuyến về công tác phòng, chống dịch với lãnh đạo sở y tế các địa phương chiều 19/8, Quyền Bộ trưởng Y tế Nguyễn Thanh Long cho biết ổ dịch ở Quảng Nam, Quảng Ngãi và Đà Nẵng đang từng bước được kiểm soát. (34) Số ca mắc giảm dần trong những ngày gần đây. (35) Từ bài học của Đà Nẵng, Quảng Nam và Hải Dương, Quyền Bộ trưởng cho rằng vấn đề đặt ra là các địa phương phải làm gì khi dịch bệnh xảy ra. (36) Thực tế, nhiều địa phương còn lúng túng trong cách xử lý. (37) Đó là lý do Bộ Y tế phải thường xuyên điều chuyên gia trung ương hỗ trợ các địa phương. “Khi xảy ra dịch ở các địa phương khác sẽ không kém phần như Đà Nẵng. Đà Nẵng là một ví dụ về vấn đề con người, cơ sở cấp cứu, dù chúng ta đã nỗ lực nhưng khổng thể cấp cứu mà phải huy động tổng lực từ trung ương đến hỗ trợ. Vậy nếu dịch xảy ra tại một tỉnh miền núi thì sẽ càng khó khăn hơn. Chúng ta phải xác định từ nay trở đi sẽ không có lúc nào bình yên mà sẵn sàng có dịch”- Quyền Bộ trưởng nói.
  • 38. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 (38) Ông Nguyễn Thanh Long cho hay chúng ta đang tìm mọi phương pháp để tiếp cận vaccine ngừa COVID-19. (39) Thời gian dự kiến sớm nhất là 6 tháng cuối năm 2021 vaccine có thể đến với người dân. Vì vậy, (40) người dân cần sẵn sàng chiến đấu với dịch. (41) Các địa phương phải chuẩn bị cho tâm thế dịch sẽ kéo dài, nếu không có vaccine, cuộc chiến chống dịch rất khó khăn. (42) Quyền Bộ trưởng Nguyễn Thanh Long cũng đề nghị các địa phương chủ động chống dịch theo phương châm 4 tại chỗ. Trung ương sẽ hỗ trợ khi cần thiết. (43) Ngoài ra, các địa phương cần chủ động mua sắm trang thiết bị, sinh phẩm và thực hiện sàng lọc theo đúng quy định để được bảo hiểm y tế thanh toán. (44) Tuy nhiên, việc sàng lọc trong cộng đồng sẽ không được thanh toán. (45) Về vấn đề trang thiết bị phòng hộ cho chống dịch, các tỉnh, thành phải đảm bảo giường cấp cứu, nhân lực. Trường hợp khoa chạy thận nhân tạo có bệnh nhân phải lập tức tách những người đang điều trị đến khu vực khác. Quyền Bộ trưởng Y tế nhấn mạnh các cơ sở y tế tuyệt đối không được chủ quan. (46) Theo Quyền Bộ trưởng Y tế, đến nay, cả nước có khoảng 150 ổ dịch. (47) Ngành y tế đã có nhiều bài học trong phòng, chống dịch như chần chừ sẽ rất nguy hiểm, phải truy tìm, cách ly nhanh để đưa mầm bệnh ra khỏi cư dân, cộng đồng. Tiếp theo, các cơ sở y tế phải có kế hoạch ứng phó để tránh trường hợp phong tỏa một loạt bệnh viện sẽ khó khăn trong điều trị người dân cần cấp cứu; phải tính sẵn phương án các bệnh viện sẽ hỗ trợ, tiếp nhận bệnh nhân trong tình huống trên địa bàn có cơ sở y tế bị "đóng băng". Do đó, địa phương phải rà soát lại tất cả các kịch bản ứng phó phòng chống dịch trên nhiều cấp độ, từ cách ly, khoanh vùng, dập dịch, điều trị, xét nghiệm..., trong đó có vấn đề tập huấn cho cán bộ y tế về truy vết, lấy mẫu... và cả vấn đề bệnh viện dã chiến trong trường hợp cần thiết… "Chúng ta phải bảo vệ điểm cốt tử của bệnh viện như khoa hồi sức, chạy thận nhân tạo và đội ngũ nhân viên y tế. Chúng ta không được nghĩ bệnh viện ngoại khoa, chuyên khoa đặc biệt sẽ không có COVID-19, phải sẵn sàng tâm thế chống dịch”- Quyền Bộ trưởng Bộ Y tế lưu ý. (48) Nhấn mạnh công tác giám sát rất quan trọng, lãnh đạo Bộ Y tế đã yêu cầu các nhà thuốc phải giám sát chặt các trường hợp mua thuốc nghi ngờ như ốm, ho, sốt, ... nếu không báo cho cơ sở y tế thì yêu cầu xử lý nghiêm. (49) Đối với các bệnh viện, nếu để tình trạng bệnh nhân nghi ngờ “lọt” thì cũng sẽ bị xử lý nghiêm. (50) Trong đợt dịch bùng phát mới đây, Đà Nẵng có số ca nhiễm SARS-CoV-2 cao nhất cả nước, tiếp theo là Quảng Nam. Ngoài ra, các tỉnh, thành khác có dịch là TP. Hồ Chí Minh, Đắk Lắk, Quảng Ngãi, Thái Bình, Đồng Nai, Hà Nam, Bắc Giang, Lạng Sơn, Quảng Trị, Thanh Hóa, Khánh Hòa, Hải Dương, Hà Nội. … Đỗ Thoa
  • 39. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 [4] EFFICIENT ALGORITHMS FOR MINING TOP-K HIGH UTILITY ITEMSETS Vincent S. Tseng, Senior Member, Cheng-Wei Wu, Philippe Fournier-Viger, Philip S. Yu, Fellow, IEEE (51) FREQUENT itemset mining (FIM) [1, 3, 8, 9, 18, 19, 20, 28, 29] is a fundamental research topic in data mining. (52) However, the traditional FIM may discover a large amount of frequent but low-value itemsets and lose the information on valuable itemsets having low selling frequencies. (53) Hence, it cannot satisfy the requirement of users who desire to discover itemsets with high utilities such as high profits. (54) To address these issues, utility mining [2, 4, 7, 10-18, 22, 23, 25, 26, 27, 29, 34, 35, 36] emerges as an important topic in data mining and has received extensive attention in recent years. (55) In utility mining, each item is associated with a utility (e.g. unit profit) and an occurrence count in each transaction (e.g. quantity). (56) The utility of an itemset represents its importance, which can be measured in terms of weight, value, quantity or other information depending on the user specification. (57) An itemset is called high utility itemset (HUI) if its utility is no less than a user-specified minimum utility threshold min_util. (58) HUI mining is essential to many applications such as streaming analysis [2, 11, 35], market analysis [13, 17, 22], mobile computing [23] and biomedicine [4]. (59) However, efficiently mining HUIs in databases is not an easy task because the downward closure property [1, 8] used in FIM does not hold for the utility of itemsets. (60) In other words, pruning search space for HUI mining is dif- ficult because a superset of a low utility itemset can be high utility. (61) To tackle this problem, the concept of transaction-weighted utilization (TWU) model [13] was introduced to facilitate the performance of the mining task. (62) In this model, an itemset is called high transaction-weighted utilization itemset (HTWUI) if its TWU is no less than min_util, where the TWU of an itemset represents an upper bound on its utility. (63) Therefore, a HUI must be a HTWUI and all the HUIs must be included in the complete set of HTWUIs. (64) A classical TWU model-based algorithm con- sists of two phases. (65) In the first phase, called phase I, the complete set of HTWUIs are found. (66) In the second phase, called phase II, all HUIs are obtained by calculating the exact utilities of HTWUIs with one database scan. (67) Although many studies have been devoted to HUI mining, it is difficult for users to choose an appropriate minimum utility threshold in practice. (68) Depending on the threshold, the output size can be very small or very large. (69) Besides, the choice of the threshold greatly influences the performance of the algorithms. (70) If the threshold is set too low, too many HUIs will be presented to the users and it is difficult for the users to comprehend the results. (71) A large number of HUIs also causes the mining algorithms to become inefficient or even run out of memory, because the more HUIs the algorithms generate, the more re- sources they consume. (72) On the contrary, if the
  • 40. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 threshold is set too high, no HUI will be found. (73) To find an appropriate value for the min_util threshold, users need to try different thresholds by guessing and re-executing the algorithms over and over until being satisfied with the results. (74) This process is both inconvenient and time-consuming. (75) To precisely control the output size and discover the itemsets with the highest utilities without setting the thre- sholds, a promising solution is to redefine the task of mining HUIs as mining top-k high utility itemsets (top-k HUIs). (76) The idea is to let the users specify k, i.e., the number of desired itemsets, instead of specifying the minimum utility threshold. (77) Setting k is more intuitive than setting the threshold because k represents the number of itemsets that the users want to find whereas choosing the threshold depends primarily on database characteristics, which are often unknown to users. (78) Using a parameter k instead of the min_util threshold is very desirable for many applications. (79) For example, to analyze customer purchase behavior, top-k HUI mining serves as a promising solution for users who desire to know (80) “What are the top-k sets of products (i.e., itemsets) that contribute the highest profits to the company?” and “How to efficiently find these itemsets without setting the min_util threshold?”. (81) Although top-k HUI mining is es- sential to many applications, developing efficient algorithms for mining such patterns is not an easy task. (82) It poses four major challenges as discussed below. (83) First, the utility of itemsets is neither monotone nor anti- monotone [1, 8]. (84) In other words, the utility of an itemset may be equal to, higher or lower than that of its supersets and subsets. (85) Therefore, many techniques developed in top-k frequent pattern mining that rely on anti-monotonicity to prune the search space cannot be directly applied to top-k high utility itemset mining. (86) The second challenge is how to incorporate the concept of top-k pattern mining with the TWU model. (87) Although the TWU model is widely used in utility mining, it is difficult to adapt this model to top-k HUI mining because the exact utilities of itemsets are unknown in phase I. (88) When a HTWUI is generated in phase I, we cannot guarantee that its utility is higher than other HTWUIs and that it is a top-k HUI before performing phase II. (89) To guarantee that all the top-k HUIs can be captured in the set of HTWUIs, a naive approach is to run the algorithm with min_util = 0. (90) However, this approach may face the prob- lem of a very large search space. (91) The third challenge is that the min_util threshold is not given in advance in top- k HUI mining. (92) In traditional HUI mining, the search space can be efficiently pruned by the algorithms by using a given min_util threshold. (93) However, in the scenario of top-k HUI mining, no min_util threshold is provided in advance. (94) Therefore, the minimum utility threshold is initially set to 0 and the designed algorithm has to gradually raise the threshold to prune the search space. (95) Such a threshold is an internal parameter of the designed algorithm and is called the border minimum utility threshold min_utilBorder in this paper. (96) It is different from the external parameter
  • 41. Viết thuê đề tài giá rẻ trọn gói - KB Zalo/Tele : 0973.287.149 min_util that is given by users in advance. (97) If an algorithm cannot raise the min_utilBorder threshold effectively and efficiently, it would produce too many intermediate low utility itemsets during the mining process, which may degrade its performance in terms of execution time and memory usage. (98) Thus the challenge is to design effective strategies that can raise the min_util threshold as high as possible and as quickly as possible, and further reduce as much as possible the number of candidates and intermediate low utility itemsets pro- duced in the mining process. (99) The last challenge is how to effectively raise the min_utilBorder threshold without missing any top-k HUIs. (100) A good algorithm is one that can effectively raise the thre- shold during the mining process.