Hội nghị đầu tiên - EMNLP"2023

Chào mọi người, mình là Dũng. Mình vừa kết thúc hành trình đầu tiên của mình tại Singapore với hội nghị EMNLP. Quả thực mình đã gặp được nhiều may mắn trên hành trình thực hiện đề tài này, từ sự support hết mình của anh mentor, chương trình nơi mình đang công tác, đặc biệt là những người anh chị em, bạn bè của mình tại FPT.

Ngẫm lại mới tháng 6 mình còn đang hì hục chạy thí nghiệm, tháng 7 nhờ mọi người trong team chỉnh sửa lại bài tại quán cafe Laika đường Láng (vì yếu tiếng anh quá nên phải nhờ mọi người hỗ trợ :>) thì giờ đã và đang ở 1 đất nước xa lạ và tham dự hội nghị đầu tiên trong đời.

Trước hội nghị

Chưa từng tham gia hội nghị khiến mình luống cuống hơn bao giờ hết. Bài tụi mình chỉ được findings nên mình phải chủ động liên hệ workshop để có thể được present in-person. Tuy đã chuẩn bị từ sớm, nhưng cuối cùng mình lại trễ deadline poster lên xuống, sau đó còn phải email cho một số người bên BTC để xin họ chỗ present bài của mình. Cũng tại vì luống cuống quá mà sau đó bài mình phải present ở tận 2 workshop trùng giờ trùng ngày (nhưng may mà là có tận 2 authors cùng đến EMNLP lần này =)) nên trong cái rủi có cái vui)

Hội nghị chính

Hội nghị EMNLP năm nay ngoài những nghiên cứu về NLP truyền thống, mình nhận thấy có phần trăm lớn nghiên cứu của năm nay tập trung làm về Large language model, cùng với việc đơn vị lớn như Google, Meta, Microsoft có một danh sách dài những paper về LLM được đăng tải tại EMNLP, mình nghĩ đây là biểu hiện từ sự quan tâm đặc biệt của cộng đồng academic lẫn industry về topic LLM và tương lai của NLP.

Các chủ đề được đón nhận về LLM bao gồm như discovering new LLM ability, hoặc các attempt đưa mô hình LLM cho natural language in general vào các bài toán cụ thể (yêu cầu knowledge domain). Vấn đề về scaling và boosting performance cho LLM cũng được đặc biệt quan tâm, nhiều giải pháp về phần cứng, giảm độ phức tạp tính toán, hay thay đổi về kiến trúc mô hình được trình bày nhằm thúc đẩy sức mạnh của LLM nói chung.

Trong đó mình đặc biệt thấy keyword “Mixture of Expert” được xuất hiện nhiều lần, (kết hợp với 1 số mô hình áp dụng MoE gần đây đang thu hút sự chú ý). Bên lề, các survey, góc nhìn tổng quát về vấn đề đạo đức (ethical issues), kiểm soát thông tin giả (fact checking), đầu ra sai sự thật (hallucination), hay những phản ứng độc hại (toxicity) do LLM sinh ra cũng dành được nhiều quan tâm. Bên cạnh đó, chủ đề về evaluation LLM đặc biệt là khoản evaluate trong các domain cụ thể càng được quan tâm với số lượng lớn publication và benchmark dataset được release.

Trải nghiệm bên lề

Ngoài 5 ngày biền biệt có mặt tại hội nghị, thật may mắn vì vẫn còn đủ thời gian tranh thủ đi ngắm đường xá Singapore và trải nghiệm ẩm thực nơi đây cùng bạn bè. Năm nay có lẽ cũng may mắn vì hội nghị tổ chức gần VN nên nhiều ace đồng nghiệp của mình cùng qua chung vui. Lần đầu xa nhà này còn nhiều bỡ ngỡ, tự nhận là tiếng anh của mình còn bập bẹ quá nên không tự tin để hỏi này nói kia được. May mắn là có anh mentor và các anh chị em đồng nghiệp cùng sang đây làm mình cảm giác như ở nhà.

Ở Singapore phương tiện công cộng phát triển rất hiện đại và tiện dụng, mình gần như có thể đi đến mọi nơi trong Singpore bằng hệ thống tàu điện (MRT) và xe bus. Những điểm trừ có lẽ với mình nói riêng là ở Sing phải đi bộ nhiều quá 😂. Đợt này mình còn mang độc mỗi đôi giày da, mỗi ngày đi bộ 5-10km làm đôi chân như rụng ra đó luôn. Tự hứa nếu có lần sau chắc chắn sẽ phải đi giày thể thao.

Thư viện ảnh

Tuy rất gần về địa lý nhưng lại có khoảng cách rất rõ rệt giữa VN và nơi đây. Ngày xưa người Singapore cảm thấy Việt Nam rất giống Sing, nhưng giờ mình cảm thấy còn phải học hỏi nhiều về cách thức mọi thứ hoạt động ở nơi đây. Mong rằng trong tương lai sẽ còn nhiều cơ hội quay lại nơi đây.

Thân.

PS: Cảm ơn @Hiếu Đào đã cho mình mượn Fuji X100F trong chuyến đi lần này.

Đảo Sentosa tuyệt đẹp. Dù Singapore là quốc đảo nhưng đảo Sentosa là một nơi đáng ghé thăm khi qua Sing.
Xe bus trên đảo Sentosa hoàn toàn miễn phí. Mình nói chuyện với các bác tài và họ nói ở Sing không có KPI cuốc nên họ cũng không vội chạy. Có lẽ 1 phần cũng vì ở Sing mình hiếm khi thấy tắc đường.
Ở Sing mọi người đi tay trái. Và mọi người chạy xe ... rất nhanh.
Nhưng luôn có lối cho người đi bộ và các phương tiện sẽ dừng từ rất xa cho người đi bộ qua đường.
Bãi biển ở Sentosa.
"Siêu" trung tâm thương mại tại Marina Bay.
"Siêu" trung tâm thương mại tại Marina Bay.
Apple Store bên trong quả cầu ở giữa đảo.
Sentosa world - nơi hội nghị chính diễn ra.
Sentosa world - nơi hội nghị chính diễn ra.
Bên trong hội nghị, khách mời của hội nghị đang trình bày.
Bên trong hội nghị, khách mời của hội nghị đang trình bày.
Bên trong hội nghị, khu vực poster.
Bên trong hội nghị, khu vực poster.
Đồ ăn được phục vụ trong ngày cuối tại hội nghị.
Cơn mưa bất chợt.
Hai nhà khoa học trẻ (trong hình là anh Nam - co-first author).
Trên tàu điện (MRT).
Đường phố sau cơn mưa.
Đường phố sau cơn mưa (Marina Bay từ xa).
Món bak tuk teh anh Khánh mời ⭐️.
Món bak tuk teh anh Khánh mời ⭐️.
Đồ ăn ... Việt Nam tại Vivo city.
Đồ ăn ... Việt Nam tại Vivo city.
Singapore nổi tiếng với các khu nhà hàng (food court) nơi họ bán đa dạng 5-10 loại đồ ăn của các nước.
Singapore nổi tiếng với các khu nhà hàng (food court) nơi họ bán đa dạng 5-10 loại đồ ăn của các nước.
Nhưng cũng vì thế nếu chỉ trải nghiệm ở food court sẽ không cảm nhận được ẩm thực của Sing.
Nhưng cũng vì thế nếu chỉ trải nghiệm ở food court sẽ không cảm nhận được ẩm thực của Sing.
Phía sau One15 marina cove.
Singapore về đêm.
Khu canteen của Đại học Quản lý Singapore (SMU).
Bên trong Universal trên đảo Sentosa.
Bên trong Universal trên đảo Sentosa.