Công nghệ [ Đăng ngày (26/09/2019) ]
Dữ liệu càng nhiều thì máy móc sẽ càng thông minh hơn
Tại Việt Nam có hơn 50 doanh nghiệp, 10 trường ĐH làm dữ liệu về giọng nói nhưng không chia sẻ, kết nối với nhau tạo thành kho dữ liệu chung. Trong khi đó, Google làm được điều này và họ có kho dữ liệu giọng nói cực lớn phục vụ cho nhiều ứng dụng của AI.


Thứ trưởng Bộ Khoa học và Công nghệ Bùi Thế Duy đặt vấn đề cần chia sẻ dữ liệu để AI trở nên hữu dụng hơn. Ảnh: Tuyết Linh.

Vấn đề về kết nối, chia sẻ dữ liệu phục vụ cho trí tuệ nhân tạo (AI) được ông Bùi Thế Duy, Thứ trưởng Bộ Khoa học và Công nghệ, đặt ra và nhấn mạnh “dữ liệu càng nhiều, máy móc sẽ càng thông minh hơn”.

Thiếu chia sẻ dữ liệu

Ông Duy nói rằng, dữ liệu đầu vào cực kỳ đa dạng. Vì thế, AI sẽ làm nhiệm vụ phân tích, chọn lọc dữ liệu cần thiết và sau đó đưa ra những quyết định. Tuy nhiên, tại VN hiện nay nhiều doanh nghiệp chưa coi trọng vai trò của dữ liệu, chưa có thói quen tích lũy dữ liệu. Còn các cơ quan nhà nước, đã xây dựng được cơ sở dữ liệu nhưng vấn đề về chia sẻ, phân loại dữ liệu với doanh nghiệp, người dân còn hạn chế.

“Tại Việt Nam có hơn 50 doanh nghiệp, 10 trường ĐH làm dữ liệu về giọng nói nhưng không chia sẻ, kết nối với nhau tạo thành kho dữ liệu chung. Trong khi đó, Google làm được điều này và họ có kho dữ liệu giọng nói cực lớn phục vụ cho nhiều ứng dụng của AI”- ông Duy nói.

Đồng tình với quan điểm này, ông Ousmane Dione, Giám đốc quốc gia, Ngân hàng Thế giới tại VN ví von, nếu như trước đây, dầu mỏ được nhiều quốc gia coi là tài nguyên quan trọng để phát triển kinh tế thì ngày nay, dữ liệu được xem là “dầu mỏ” để phát triển kinh tế dựa trên nền tảng công nghệ, cụ thể là AI. Bởi không có máy tính nào có thể giải quyết vấn đề nếu như không có dữ liệu đầu vào. Sau đó, từ nguồn dữ liệu này AI có thể học và phân tích để ra quyết định.

Vì thế, ông Ousmane Dione cho rằng, thách thức lớn nhất của quốc gia trong việc phát triển AI là vấn đề con người, liệu họ có quan tâm và thực sự coi trọng dữ liệu. Thậm chí, khi có dữ liệu nhưng lại ở dạng phân tán, nguồn lưu trữ không giống nhau, không có nền tảng để chia sẻ dữ liệu… thì dữ liệu không thể giải quyết được vấn đề, mang lại những lợi ích kinh tế, xã hội.

Ông Nguyễn Thiện Nghĩa, Vụ phó Vụ CNTT, Bộ Thông tin và Truyền thông ví von, ngày xưa nhà nước hỗ trợ đất đai cho doanh nghiệp làm ăn, thì hiện nay, vấn đề này cần được chuyển đổi. Nhà nước cần cung cấp, chia sẻ dữ liệu, hạ tầng công nghệ cho doanh nghiệp khai thác và tận dụng tối đa công nghệ để khai thác dữ liệu, phục vụ cho doanh nghiệp sản xuất, kinh doanh.

Dữ liệu càng nhiều thì máy móc sẽ càng thông minh hơn - 2
Một sản phẩm AI của sinh viên ĐH Sư phạm Kỹ thuật TP.HCM, có khả năng thực hiện các công việc bằng giọng nói. Ảnh: Hà Thế An.


Phát triển dữ liệu phải đi liền với vấn đề bảo mật

Theo PGS.TS Trần Minh Triết, Phó hiệu trưởng ĐH Khoa học Tự nhiên, ĐH Quốc gia TP.HCM, dữ liệu được thu thập và khai thác để sử dụng trong AI cũng cần cẩn trọng. Bởi hiện nay, những đối tượng xấu có khả năng tạo ra những dữ liệu giả, dữ liệu không chính xác. Điều này sẽ khiến AI đưa ra quyết đinh sai lầm và có thể phục vụ cho những mục đích xấu.

PGS Triết phân tích, cụ thể ở một khía cạnh đơn giản. Camera thông minh có thể sử dụng hình ảnh để đếm người và thu thập dữ liệu này. Tuy nhiên, một số người lại sử dụng thêm những hình ảnh, như cầm một bức tranh có in hình người. Như vậy AI sẽ tự thu thập thêm hình ảnh trong bức tranh và tự mặc định rằng, đó là một con người. Và có thể đưa ra những dữ liệu không chính xác.

“Phân tích ví dụ đơn giản trên để thấy rằng, từ những dữ liệu không chính xác, AI có thể ra quyết định sai, phục vụ cho mục đích của những tổ chức, cá nhân có ý đồ xấu. Vì thế, bên cạnh máy móc, cần phải có tri thức và sự linh hoạt của con người để có thể đưa ra những quyết định phù hợp. AI cần con người để nó là một trí tuệ nhân tạo thông minh một cách chân chính”- PGS Triết chia sẻ.

Còn theo PGS.TS Vũ Hải Quân, Phó giám đốc ĐH Quốc gia TP.HCM, chính quyền thành phố cần có một thực thể về đào tạo và nghiên cứu AI. Thực thể này là đầu mối đề xuất các quy định về việc đảm bảo toàn vẹn dữ liệu, bảo mật dữ liệu, chia sẻ dữ liệu… cho từng giải pháp ứng dụng AI vào đời sống, sản xuất.

“Các Sở, ngành của TP.HCM cần xây dựng các API (giao diện lập trình ứng dụng) dữ liệu mở, cung cấp thông tin cho cho nhà khoa học, doanh nghiệp tư nhân, cá nhân có thể cùng phát triển các dịch vụ đa dạng cho thành phố từ cơ sở dữ liệu này. Người dân cũng sẽ tuân thủ các quy định về an toàn dữ liệu, an toàn thông tin”- PGS Quân thẳng thắn.

Ông Nguyễn Trung Chính, Chủ tịch HĐQT công ty CMC cho rằng, Nhà nước cần xây dựng hành lang pháp lý trong việc phân cấp quyền truy cập dữ liệu cho từng đối tượng (người dân, doanh nghiệp, cơ quan quản lý,…) nhằm đảm bảo vấn đề về an toàn thông tin.

“Chúng tôi đã xây dựng các chương trình về bảo mật từ nhiều năm nay và có hẳn một nhóm chuyên gia chuyên làm về lĩnh vực này", ông Chính nói đồng thời bày tỏ sẵn sàng hợp tác với chính quyền TP.HCM về an ninh mạng, an toàn dữ liệu.

Tại hội thảo quốc tế về AI tổ chức mới đây, Bí thư Thành ủy TP.HCM Nguyễn Thiện Nhân chia sẻ, cần phải có đề án số hóa tài nguyên về hồ sơ nhà nước, dữ liệu các ngành… Đề án này phải làm nhanh làm ngay, không chờ đợi, vì có những dữ liệu thì AI mới hoạt động. Để làm đề án này cần có sự chung tay của doanh nghiệp, với những nguồn dữ liệu của ngành mình, lĩnh vực mình đang làm.

“Vấn đề này, chúng tôi đã làm việc với Bộ Thông tin và Truyền thông, dự kiến vào cuối năm nay sẽ ra đề án về số hóa dữ liệu”- ông Nhân nói.

Hà Thế An
Theo www.khampha.vn (tnttrang)
In bài viết  
Bookmark
Ý kiến của bạn
Lên đầu trang
© Copyright 2013 Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Địa chỉ: 118/3 Trần Phú - P.Cái Khế - Q.Ninh Kiều - TPCT
Giấy phép số: 05/ GP-TTĐT, do Sở Thông tin và Truyền Thông thành phố Cần Thơ cấp ngày 23/5/2017
Trưởng Ban biên tập: Ông Vũ Minh Hải - Giám Đốc Trung tâm Thông tin Khoa học và Công nghệ - Sở Khoa học & Công nghệ TP. Cần Thơ
Ghi rõ nguồn www.canthostnews.vn khi bạn sử dụng lại thông tin từ website này
Lượt truy cập: