Nghiên cứu và giải mã “Độ phức tạp của văn bản dưới góc độ người đọc” cùng chuyên gia AI – Google

29/05/2023 Quỳnh

Sáng 29/05/2023, sinh viên Đại học FPT đã được trải nghiệm học hỏi nghiên cứu khoa học cùng chuyên gia AI Google với Talkshow nghiên cứu và “giải mã” độ phức tạp của văn bản dưới góc độ người đọc. Chương trình diễn ra sôi nổi với những chia sẻ thực tế thú vị của diễn giả – Tiến sĩ Sian Gooding dành cho sinh viên Đại học FPT, đến từ dự án nghiên cứu chuyên sâu về Reinforcement learning (Học tăng cường) tại Google.

Talkshow ứng dụng AI nghiên cứu và giải mã “Độ phức tạp của văn bản dưới góc độ người đọc” vào buổi sáng 29/05/2023 diễn ra tại Hội trường B – Đại học FPT (Campus TP. HCM) thu hút đông đảo sinh viên Đại học FPT và khách mời quan tâm lĩnh vực Trí tuệ nhân tạo tham gia. Chương trình còn có sự góp mặt của những chuyên gia thực chiến xuất sắc tại doanh nghiệp như các nhà hoạch định chính sách, nhà nghiên cứu đến từ Đại học FPT, FPT Software, Tập đoàn FPT, Đại học Cambridge.

dai hoc fpt 1 — Tiến sĩ Sian Gooding, Nhà nghiên cứu khoa học – Google Research (London, Anh), với những nghiên cứu đột phá và đóng góp quan trọng cho lĩnh vực Trí tuệ nhân tạo tại Google – Diễn giả – Chuỗi Talkshow “AI Research For Educational Technology” tại Đại học FPT

Với mục tiêu Trao đổi nghiên cứu về việc Ứng dụng AI, tại Talkshow đầu tiên trong chuỗi “AI Research For Educational Technology”, Tiến sĩ Sian Gooding (Đại học Cambridge) chia sẻ về nghiên cứu khả năng đọc văn bản từ hành vi cuộn của người học. Đây là công trình nghiên cứu và kết quả của một dự án thực tế từ Google. Tiến sĩ Sian Gooding cho biết, dự án này có ý nghĩa to lớn trong việc xây dựng công nghệ giáo dục có thể đơn giản hóa văn bản một cách hiệu quả cho mọi đối tượng người học trên thế giới.

Trong Talkshow ứng dụng AI nghiên cứu độ phức tạp của văn bản trong mắt người xem – dự đoán khả năng đọc văn bản từ hành vi cuộn của người học, Tiến sĩ Sian Gooding chỉ ra hành vi cuộn máy tính liên quan như thế nào đến khả năng đọc được các văn bản tiếng Anh. Cô cung cấp công khai bộ dữ liệu từ dự án nghiên cứu của Google và cho biết ứng dụng AI vào nghiên cứu có thể thấy sự khác biệt đáng kể trong cách người đọc tương tác với văn bản tùy thuộc vào cấp độ văn bản, cũng như dự đoán được khả năng đọc văn bản của người dùng và bối cảnh của người đọc ảnh hưởng đến quá trình đọc và tương tác với văn bản của họ. Cô cũng chỉ ra các yếu tố góp phần gây khó khăn cho việc đọc văn bản ở các nhóm người học khác nhau.

dai hoc fpt 2

Dự án nghiên cứu thực tế từ Google chỉ ra, các vấn đề thực tế người dùng đang gặp như: nhà phát triển phần mềm/ứng dụng chủ quan cho rằng văn bản đã hoàn thiện và thiếu quan tâm đến trải nghiệm cá nhân của người dùng. Văn bản liên quan đến khái niệm, đàm luận, cú pháp, từ vựng. Các phương pháp học máy truyền thống để đo lường khả năng đọc chỉ dựa vào các đặc điểm ngôn ngữ đó. Tuy nhiên, việc chỉ sử dụng các tính năng này không thực sự hiệu quả cho nội dung trực tuyến vì nội dung đó thường chứa chữ viết tắt, biểu tượng cảm xúc, văn bản bị hỏng và đoạn văn ngắn, điều này làm giảm hiệu suất trong tính dễ đọc của văn bản. Và đối với nhiều cá nhân, việc đọc mẫu thông tin, ngày nay chủ yếu thực hiện trên thiết bị đã thay thế các nguồn đọc truyền thống, là cực kỳ khó khăn.

Từ đó thấy được cần thiết trong việc thiết kế các ứng dụng giáo dục cho người đọc và người học ngôn ngữ có trình độ thấp, bởi vì nó có thể được sử dụng để so khớp người học với các văn bản có trình độ phù hợp cũng như hỗ trợ người đọc dễ tiếp thu các văn bản vượt quá khả năng đọc-hiểu của họ trên nền tảng trực tuyến. Với mục tiêu xây dựng công cụ để trao quyền cho độc giả và ứng dụng trí tuệ nhân tạo giúp đơn giản hóa văn bản, học ngôn ngữ, dự đoán khả năng đọc, diễn giả giới thiệu CWI. Đây là hệ thống nhằm mục đích tự động xác định những từ ngữ khó hiểu cho người đọc mục tiêu. Hệ thống CWI hoạt động bằng cách đào tạo sử dụng các chú thích của nhóm mục tiêu với các tính năng khác nhau tùy thuộc vào đối tượng mục tiêu và các mô hình cụ thể đối tượng. Dự án tạo các mô hình được cá nhân hóa theo hướng học chủ động và phản hồi ngầm ở người học.

dai hoc fpt 6

Tiến sĩ Gooding cho biết, một thuật toán học máy có thể đạt được độ chính xác cao hơn nếu nó được cho phép để chọn dữ liệu từ ít các trường hợp đào tạo được dán nhãn để học. Từ đó đưa ra thiết kế nghiên cứu về đào tạo bộ phân loại ban đầu, truyền nhãn thông qua phân cụm để xác định tần số từ, ngôn ngữ tâm lý, từ vựng, cơ sở từ vựng cùng bộ kiểm nghiệm cho cá nhân. Cũng như các biện pháp thiết kế nghiên cứu khác: trình bày cho người tham gia các văn bản ở các mức độ dễ đọc khác nhau, đo lường tương tác của người dùng trong khi đọc, đặt câu hỏi đọc hiểu tập dữ liệu…

Dự án đi đến kết luận việc nghiên cứu độ phức tạp của văn bản dưới góc độ người đọc sử dụng phương pháp học tích cực, có thể xây dựng các mô hình từ riêng lẻ phức tạp, các mô hình riêng lẻ cho phép dễ đọc, và đơn giản hóa qua hệ thống cá nhân hóa. Diễn giả cũng cho biết Google phát hành bộ dữ liệu chứa các chú thích về độ phức tạp của 44.000 từ, siêu dữ liệu người tham gia và phân loại trong dự án nghiên cứu này. Đồng thời kết luận có sự khác biệt có ý nghĩa thống kê trong cách người đọc tương tác với văn bản nâng cao và tiểu học, phản hồi ẩn của người dùng cung cấp thông tin chi tiết về khả năng đọc cá nhân và tính năng cuộn khi đọc để dự đoán khả năng đọc văn bản của người dùng.

dai hoc fpt 7

Tại Talkshow, diễn giả cùng khách mời là nhà nghiên cứu, chuyên gia AI, giảng viên, sinh viên Đại học FPT cũng có những ý kiến thảo luận chuyên sâu về ứng dụng AI để nghiên cứu những khía cạnh góp phần tạo nên độ phức tạp về từ vựng ở các nhóm người học khác nhau, tập trung vào những người nói tiếng Anh bản ngữ và không bản phải ngữ. Khái niệm về độ phức tạp thay đổi như thế nào tùy thuộc vào trình độ thành thạo của người đọc không phải người bản xứ.

Dự án nghiên cứu độ phức tạp của văn bản dưới góc độ người đọc được ứng dụng AI do diễn giả chia sẻ cho biết mức độ dễ đọc của văn bản mang đến nhiều ứng dụng quan trọng, chẳng hạn như ứng dụng để đơn giản hóa văn bản hoặc khi tìm nguồn tài liệu đọc cho người học. Công trình này là kết quả của một dự án nghiên cứu của Google đang diễn ra và có ý nghĩa to lớn trong việc xây dựng công nghệ giáo dục có thể đơn giản hóa văn bản một cách hiệu quả cho mọi đối tượng người học.

dai hoc fpt 4
Chuỗi chương trình “AI Research For Educational Technology” mục tiêu Nghiên cứu AI ứng dụng công nghệ trong giáo dục được tổ chức với 02 nội dung Talkshow chính: Độ phức tạp của văn bản dưới góc độ người đọc (09:00-11:00 ngày 29/05) và Reinforcement learning (Học tăng cường) cho các mô hình ngôn ngữ (lớn) trong giáo dục (14:00-16:00 ngày 29/05). Bên cạnh, với mục tiêu truyền cảm hứng cho cộng đồng, chuyên gia AI Google chia sẻ hành trình thành công trong khoa học với Talkshow “Successful Women in Science” dành cho Nữ giới (09:00-11:00 ngày 30/05).

Chuỗi Talkshow “AI Research For Educational Technology” diễn ra từ ngày 29 – ngày 30/5/2023 tại Đại học FPT. Khách mời tham dự nói chung và sinh viên Đại học FPT nói riêng được trực tiếp nghiên cứu khoa học và được truyền kinh nghiệm thực chiến, cảm hứng theo đuổi ngành Trí tuệ nhân tạo trong giai đoạn AI bùng nổ hiện nay cùng các chuyên gia, nhà nghiên cứu:

Sian Gooding – Tiến sĩ Đại học Cambridge, chuyên gia về AI-NLP xử lý ngôn ngữ tự nhiên, diễn giải và ứng dụng AI cho giáo dục, hiện là Nhà nghiên cứu khoa học về AI tại Google Research với những nghiên cứu đột phá và đóng góp quan trọng cho lĩnh vực Trí tuệ nhân tạo tại Google
Christopher Bryant – Tiến sĩ Đại học Cambridge, chuyên gia về AI-NLP xử lý ngôn ngữ tự nhiên, hiện là Cộng tác viên nghiên cứu lĩnh vực AI-NLP tại Đại học FPT, đồng thời là Nhà nghiên cứu khoa học tại Đại học Cambridge, Nhà nghiên cứu ứng dụng AI tại Writer Inc
Nguyễn Hoàng Bảo Nguyên, Tiến sĩ Đại học Cambridge, hiện là Giảng viên – Nghiên cứu viên tại Đại học FPT, đồng thời duy trì các dự án nghiên cứu tại Đại học Cambridge và Đại học Quốc gia Úc

Sinh viên Đại học FPT được trực tiếp lắng nghe, giải đáp thắc mắc cùng diễn giả của chương trình – Tiến sĩ Sian Gooding. Hiện tại, Tiến sĩ Sian Gooding tập trung nghiên cứu về khả năng diễn giải AI và các ứng dụng AI cho giáo dục. Với những nghiên cứu chuyên sâu về AI từ chuyên gia, sinh viên Đại học FPT có cơ hội học hỏi kỹ năng, kinh nghiệm cho việc nghiên cứu và ứng dụng Trí tuệ nhân tạo, cải thiện trải nghiệm của người dùng, đặc biệt trong lĩnh vực giáo dục. Cũng như được chia sẻ về hành trình định vị trong lĩnh vực học thuật lẫn thị trường công nghệ tiến bộ hiện nay. Bên cạnh, các bạn còn được lắng nghe những thách thức đối với nữ giới và những bài học dành cho những nhà nghiên cứu trẻ, từ đó truyền cảm hứng cho nữ giới gia nhập thế giới khoa học công nghệ.

Theo FPTU HCM

Từ khóa: