Cách kỹ sư Việt lọt top 3% xuất sắc cuộc thi về Data-Centric trên thế giới

Quang Vũ | 24-12-2021 - 13:25 PM

(Tổ Quốc) - Vừa qua, nhóm ba kỹ sư đại diện FPT Software đã xuất sắc lọt vào danh sách 3% những đội thi có kết quả cao nhất tại cuộc thi quốc tế Data-Centric AI Competition. Cuộc thi hàng đầu thế giới về phân tích, xử lý dữ liệu trong trí tuệ nhân tạo, khởi xướng bởi thiên tài học sâu (deep learning) Andrew Ng - đồng sáng lập Google Brain, Coursera.

Cách kỹ sư Việt lọt top 3% xuất sắc cuộc thi về Data-Centric trên thế giới - Ảnh 1.

Đội thi đến từ FPT Software đạt thứ hạng 17 trên bảng xếp hạng

Sau hơn hai tháng tháng tranh tài, đội FPT Augmentor với ba thành viên là các kỹ sư công nghệ đến từ FPT Software đã cán đích ở vị trí 17 tại sân chơi Trí tuệ Nhân tạo thế giới. Đặc biệt, hai trong ba thành viên của đội thi là những sinh viên mới ra trường, sinh năm 2000.

Data-Centric AI Competition do DeepLearning.ai và Landing AI tổ chức, là cuộc thi về trí tuệ nhân tạo quốc tế được khởi xướng bởi Andrew Ng, người được mệnh danh là thiên tài AI và học sâu của thế giới. Cuộc thi quốc tế này tập trung vào hướng tiếp cận huấn luyện AI dựa trên bộ dữ liệu sạch, tối ưu thời gian và công sức huấn luyện trí tuệ nhân tạo, cũng như mang đến nhiều lợi thế cho các doanh nghiệp thuộc nhiều lĩnh vực cùng tham gia xây dựng AI. Cuộc thi thu hút gần 500 đội thi đến từ nhiều nước khác nhau và quy tụ nhiều tài năng khoa học đang làm việc tại các doanh nghiệp hàng đầu trên toàn thế giới.

Chia sẻ về lý do tham gia cuộc thi, Thanh Tuấn, một trong ba thành viên của Đội FPT Augmentor, chuyên gia dữ liệu của FPT Software cho biết, "Đứng trước một dự án trí tuệ nhân tạo, các kỹ sư và lập trình viên luôn phải đau đầu tìm ra những phải pháp để cải thiện hiệu quả dự đoán. Câu hỏi đặt ra là bạn nên thử thật nhiều mô hình khác nhau hay tập trung vào nâng cao chất lượng dữ liệu, phải tìm giải pháp tối ưu và thực tế nhất. Và thật tuyệt khi một trong những người đứng đầu lĩnh vực trí tuệ nhân tạo thế giới - Giáo sư Andrew Ng tạo ra một sân chơi dành lớn và vô cùng chuyên nghiệp."

Với Data-Centric AI Competition, các đội thi sẽ nhận đề bài liên quan đến bộ dữ liệu về chữ cái theo ký hiệu roman. Người chơi cần sử dụng các kỹ thuật xử lý dữ liệu, nộp các thư mục ảnh không quá 10.000 ảnh và tính toán kết quả dựa trên tính chính xác. Trong suốt quá trình tham gia cuộc thi, các kỹ sư dữ liệu được yêu cầu đưa ra quyết định và phân tích các thông số kỹ thuật, từ đó đưa ra những thay đổi và giải pháp nhằm nâng cao chất lượng của tập dữ liệu ban đầu.

Cách kỹ sư Việt lọt top 3% xuất sắc cuộc thi về Data-Centric trên thế giới - Ảnh 2.

Ba thành viên tài năng của đội thi đến từ FPT Software

"Khi chạy thử, chúng tôi nhận ra mô hình chưa học được những ảnh khó, vì thế chúng tôi nhặt mỗi lớp ra những ảnh khó và lạ để tập trung tăng cường tập những ảnh này và đạt được kết quả 84,256%." - Tuấn chia sẻ thêm về quá trình ghi danh vào nhóm top đầu trên "bảng vàng".

Được truyền cảm hứng bởi cuộc thi quốc tế trên, tại Việt Nam, FPT Software cũng lần đầu tiên đăng cai tổ chức cuộc thi Data-Centric AI Competition trong năm 2021. Đề bài của cuộc thi tại Việt Nam có chủ đề "Đeo khẩu trang" với bộ dữ liệu gồm 976 ảnh có gán nhãn theo 3 lớp: đeo khẩu trang, không đeo khẩu trang và đeo khẩu trang sai.

Ban tổ chức cung cấp một bộ mô hình đã được huấn luyện cùng tập public test gồm 89 ảnh để thí sinh có thể đánh giá sơ bộ về mô hình, nhằm tìm ra những giải pháp thông minh trong phòng chống đại dịch Covid-19. Các thí sinh tham dự cuộc thi được hướng dẫn bởi những chuyên gia AI hàng đầu thế giới: Prof Andrew Ng, Giảng viên Đại học Stanford - Huyền Chip, Google - Hữu Tiệp,... Bạn đọc có thể xem thêm thông tin tại Link

Tại FPT Software, hướng tiếp cận tập trung vào dữ liệu (data-centric) cũng được áp dụng rộng rãi trong các dự án Trí tuệ nhân tạo, giúp chuyên gia dễ dàng xử lý các bài toán với tập dữ liệu từ nhỏ đến lớn trong nhiều ngành nghề khác nhau như hàng không, y tế, tài chính, bảo hiểm mà không cần thay đổi quá nhiều về mô hình. Phương pháp này giúp các kỹ sư tiết kiệm thời gian, đồng thời tăng cường hiệu quả và độ chính xác của dự án.

CÙNG CHUYÊN MỤC
XEM