Tin học [ Đăng ngày (31/05/2019) ]
Phát triển hệ thống phát hiện đạo văn cho trường Đại học Việt Nam
Đạo văn được biết đến như một vấn nạn trong môi trường học thuật. Bên cạnh các chế tài nghiêm ngặt cho người đạo văn, cần có những công cụ hiệu quả để ngăn chặn, không để xảy ra tình trạng đạo văn trong trường đại học và trong sinh viên.


(Ảnh minh họa)

Đã có nhiều ứng dụng được xây dựng để phát hiện đạo văn. Tuy nhiên, các sản phẩm này thường là khá đắt đỏ và chưa được kiểm chứng có thực sự phù hợp với nguồn tài liệu tiếng Việt hay không. Chúng thường dựa trên các thuật toán phát hiện đạo văn của riêng mình và thường thì không thể bổ sung hay tùy biến nhằm phù hợp với môi trường và ngôn ngữ tiếng Việt. Ngoài ra, khả năng mở rộng cũng là một tính năng quan trọng đối với một hệ thống phát hiện đạo văn vì số lượng tài liệu trong cơ sở dữ liệu là rất lớn và tăng lên nhanh chóng.

Nhằm xây dựng một hệ thống phát hiện sao chép để phát hiện đạo văn với các tính năng quan trọng: làm việc trên một cơ sở dữ liệu riêng, lớn của một tổ chức như trường đại học; linh hoạt, dễ mở rộng; đáp ứng hiệu năng tính toán mong đợi, nhóm tác giả Trần Cao Đệ, Lê Văn Lâm, Bùi Võ Quốc Bảo, Nguyễn Gia Hưng và Trần Cao Trị (Khoa Công nghệ Thông tin & Truyền thông, Trường Đại học Cần Thơ) đã thực hiện nghiên cứu “Phát triển hệ thống phát hiện đạo văn cho trường Đại học Việt Nam”.

Qua nghiên cứu, nhóm tác giả đã sử dụng phương pháp của Kasprzak và JPPF để phát triển hệ thống phát hiện đạo văn. Hệ thống phát hiện đạo văn của nhóm tác giả có thể làm việc trên cơ sở dữ liệu định sẵn, linh hoạt và có khả năng mở rộng. Nhóm tác giả sửa đổi một số tính năng từ phương pháp của Kasprzak để làm cho nó làm việc tốt trong môi trường tiếng Việt. Trong khi đó, giải pháp JPPF giúp hệ thống của chúng tôi cải thiện thời gian tính toán. Các kết quả thử nghiệm trên cả hai tập dữ liệu (PAN và CSDL ĐHCT) cho thấy rằng hệ thống phát hiện đạo văn của chúng tôi có kết quả khá tốt trong cả hai thông số: thời gian tính toán và độ chính xác. Trong tương lai, chúng tôi tiếp tục nghiên cứu tích hợp phương pháp ngữ nghĩa tiềm ẩn vào việc lọc các tài liệu tiềm năng để có thể cải tiến hơn nữa hiệu năng của hệ thống. Ngoài ra, sử dụng Google để tìm kiếm tài liệu tiềm năng cũng được xác định như là một hướng phát triển của đề tài nhằm mở rộng phạm vi phát hiện đạo văn.

TC Khoa học Trường Đại học Cần Thơ(ntdien)
In bài viết  
Bookmark
Ý kiến của bạn
Lên đầu trang
© Copyright 2013 Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - P.Cái Khế - Q.Ninh Kiều - TPCT
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.canthostnews.vn khi bạn sử dụng lại thông tin từ website này
Lượt truy cập: