Tin học [ Đăng ngày (31/05/2019) ]
Tư vấn lai ghép dựa trên các độ đo hàm ý thống kê
Nhằm đề xuất một mô hình tư vấn lai ghép dựa trên các độ đo hàm ý thống kê nhằm gợi ý cho người dùng danh sách các mục dữ liệu phù hợp, nhóm tác giả Phan Lan Phương, Huỳnh Xuân Hiệp (Khoa Công nghệ Thông tin và Truyền thông, Trường Đại học Cần Thơ) và Huỳnh Hữu Hưng (Khoa Công nghệ Thông tin, Trường Đại học Bách khoa, Đại học Đà Nẵng đã thực hiện nghiên cứu “Tư vấn lai ghép dựa trên các độ đo hàm ý thống kê”.


Hệ tư vấn (recommendation system/recommender system - RS) (Ricci, 2011) là kỹ thuật hay công cụ phần mềm được nhúng trong một ứng dụng hoặc trang web để dự đoán sở thích của một cá nhân hoặc một nhóm người dùng đối với một sản phẩm hoặc dịch vụ cụ thể; và/hoặc giới thiệu các sản phẩm hoặc dịch vụ thích hợp cho một cá nhân hoặc một nhóm người dùng, qua đó giúp àm giảm tình trạng quá tải thông tin. Vì vậy, các hệ tư vấn được áp dụng trong nhiều lĩnh vực của uộc sống (Lu et al., 2015) như thương mại điệntử, dịch vụ điện tử... Các kỹ thuật (phương pháp) tư vấn được chia thành hai lớp chính (Aggarwal,2016; Jannach et al., 2011; Ricci, 2011): lớp các kỹ thuật cơ bản như lọc cộng tác, lọc nội dung hay dạng lai ghép; và lớp các kỹ thuật được phát triển trên nền những kỹ thuật cơ bản kết hợp với các thông tin bổ sung dựa trên ngữ cảnh hay mạng xãhội. Theo kỹ thuật tư vấn, các hệ tư vấn được phân thành nhiều nhóm khác nhau (Aggarwal, 2016;Jannach et al., 2011; Ricci, 2011) dựa trên: nội dung, lọc cộng tác, nhân khẩu học, tri thức, lai ghép, ngữ cảnh, mạng xã hội và theo nhóm. Trong các hướng nghiên cứu về hệ tư vấn, việc đề xuất các mô hình tư vấn mới hay cải tiến các phương pháp tư vấn hiện có là hướng nghiên cứu cốt lõi và nhận được nhiều quan tâm nhất. Hệ tư vấn lai ghép (hybrid recommendationsystem) là hệ thống kết hợp hai hoặc nhiều kỹ thuật tư vấn để đạt được hiệu suất tốt hơn và để khắc phục những mặt hạn chế của từng kỹ thuật. Các hệtư vấn lai có thể được phân thành bảy biến thể:trọng số, chuyển mạch, tầng, bổ sung đặc trưng, kết hợp đặc trưng, siêu mức (meta-level), và hỗn hợp (Aggarwal, 2016; Burke, 2007); và được thiết kế theo một trong ba dạng (Jannach et al., 2011): nguyên khối, song song và tuần tự. Trong đó, thiết kế song song có ưu điểm là ít xâm lấn nhất đối với những thực thi hiện có. Cụ thể, các hệ tư vấn khác nhau hoạt động độc lập với nhau, và các dự đoán của từng hệ riêng lẻ được kết hợp vào lúc cuối. Phân tích hàm ý thống kê (StatisticalImplicative Analysis) (Gras et al., 2009) là phương pháp phân tích dữ liệu dựa trên các độ đo hàm ý thống kê. Chúng được sử dụng để phát hiện các khuynh hướng giữa các thuộc tính dữ liệu (những mối quan hệ hàm ý mạnh), hay đo tính điển hình của một đối tượng đối với sự hình thành của một mối quan hệ, hay đo trách nhiệm của một đối tượng đối với sự tồn tại của một mối quan hệ. Vì vậy, những độ đo hàm ý thống kê có thể được sử dụng trong các hệ tư vấn. Bài báo này đề xuất một mô hình tư vấn lai ghép mới dựa trên lọc cộng tác sử dụng k người dùng gần nhất và dựa trên tập luật kết hợp để gợi ý top k mục dữ liệu cho người cần được tư vấn. Dữ liệu đầu vào của mô hình là các đánh giá ở dạng nhị phân. Trong mô hình đề xuất, một số độ đo hàm ý thống kê được kết hợp thành những độ đo dùng để xếp hạng và lọc ra những mục phù hợp nhất.

Nghiên cứu đã đề xuất một mô hình tư vấn lai ghép được phát triển trên hai mô hình tư vấn con (lọc cộng tác dựa trên người dùng, tập luật kết hợp) và một số độ đo hàm ý thống kê quan trọng nhằm gợi ý cho người dùng các mục dữ liệu phù hợp. Mô hình đề xuất sử dụng: (1) - dữ liệu đầu vào ở dạng nhị phân; (2) - độ đo cường độ hàm ý để tìm những láng giềng gần nhất của người cần được tư vấn và lọc tập luật; (3) - độ đo ArIR được kết hợp từ cường độ hàm ý và độ tin cậy, độ đo KnnIR được xây dựng dựa trên tính tiêu biểu, và độ đo IR đượchình thành từ ArIR và KnnIR để dự đoán các giá trị đánh giá/xếp hạng của người cần được tư vấn cho các mục dữ liệu trong từng mô hình con và mô hình lai ghép. Các kết quả thực nghiệm trên tập dữ liệu chuẩn MSWeb và tập dữ liệu thực DKHP cho thấy mô hình lai ghép đề xuất có hiệu suất tốt hơn so với các mô hình con của nó cũng như so với các mô hình tư vấn được tích hợp trong gói recommenderlab như: nhân tố tiềm ẩn, dựa trên các mục dữ liệu phổ biến nhất, và lọc cộng tác dựa trên người dùng sử dụng độ đo Cosine.

TC Khoa học Trường Đại học Cần Thơ(ntdien)
In bài viết  
Bookmark
Ý kiến của bạn
Lên đầu trang
© Copyright 2013 Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - P.Cái Khế - Q.Ninh Kiều - TPCT
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.canthostnews.vn khi bạn sử dụng lại thông tin từ website này
Lượt truy cập: