Dù mô hình ngôn ngữ lớn "chiếm sóng dư luận", ngôn ngữ nhỏ mới là thứ "làm nên chuyện"

Mai Anh

07/11/2025

Làn sóng trí tuệ nhân tạo hiện đại đang chứng kiến một nghịch lý: những mô hình phức tạp đang được các công ty sử dụng để tạo ra hiệu quả làm việc và cắt giảm nhân sự lại không phải là những mô hình nổi tiếng có nhiều sự chú ý…

Mô hình ngôn ngữ nhỏ có thể dễ dàng điều chỉnh theo các tác vụ cụ thể. Ảnh: Shutterstock

Những mô hình tiên tiến và có khả năng suy luận nhanh hơn, tốt hơn liên tục xuất hiện trên câu chủ đề của các tờ báo nhờ khả năng liên tục phá vỡ các kỷ lục về nhận thức và phân tích. Những mô hình này thậm chí còn vượt qua các kỳ thi về luật và y học, hay cả Olympic toán học.

Lãnh đạo của các phòng thí nghiệm trí tuệ nhân tạo (AI) hàng đầu, từ ông Sam Altman của OpenAI, ông Dario Amodei của Anthropic, ông Demis Hassabis của DeepMind (thuộc Google) cho đến tỷ phú Elon Musk của xAI, đều nói về một tương lai với AGI – trí tuệ nhân tạo tổng quát. Đó là viễn cảnh nơi máy móc thông minh ngang ngửa con người.

Theo giả thuyết, chính những “bộ não khổng lồ” này của AI sẽ là mối đe dọa lớn nhất đối với việc làm của con người.

Thế nhưng, khi trò chuyện với các giám đốc điều hành tại những công ty đang ứng dụng AI mỗi ngày, một câu chuyện hoàn toàn khác đang diễn ra trên thực tế, tác giả Christopher Mims viết trên tờ The Wall Street Journal (WSJ).

Với phần lớn tác vụ, không phải những mô hình AI lớn nhất và thông minh nhất đang chiếm ưu thế, mà là những mô hình đơn giản hơn. Những “anh hùng thầm lặng” này của AI – những mô hình thực sự đang thay đổi quy trình kinh doanh và lực lượng lao động – lại là những mô hình nhỏ nhất, nhanh nhất và rẻ nhất.

“Thực tế là, với rất nhiều hoạt động tính toán mà chúng ta cần hiện nay, chúng ta không nhất thiết phải dùng đến các mô hình ngôn ngữ lớn”, ông Kyle Lo, một nhà khoa học nghiên cứu tại Viện Allen về AI, cho biết.

Các công ty ứng dụng AI thành công thường xây dựng phần mềm và dịch vụ như một dây chuyền sản xuất AI: thông tin đi vào một đầu, và rồi dữ liệu, hành động hoặc sản phẩm đi ra ở đầu kia. Ở giữa, hàng loạt AI nhỏ hơn, đơn giản hơn, chuyên biệt hơn, nhanh hơn và rẻ hơn đang làm toàn bộ công việc.

Những doanh nghiệp cần triển khai AI ở quy mô lớn đang phát hiện ra rằng, các mô hình ngôn ngữ nhỏ hoàn toàn đủ khả năng để đảm nhiệm các nhiệm vụ đó. Hơn nữa, doanh nghiệp cũng nhận ra rằng họ gần như không có lựa chọn nào khác, bởi những mô hình này rẻ hơn và trong nhiều trường hợp, còn phù hợp hơn với yêu cầu thực tế.

Đó chính là cách mà tương lai của AI tự động được hình thành – theo từng quy trình một.

XÂY DỰNG NHÀ MÁY AI TỪ MÔ HÌNH NGÔN NGỮ NHỎ

Có thể trông như thể các hệ thống AI đang ngày càng mạnh mẽ hơn vì những mô hình nền tảng thông minh hơn, và sự thật đúng là các mô hình lớn đang tiếp tục phát triển.

Tuy nhiên, trong nhiều trường hợp, sự thật đằng sau năng suất tăng trưởng của doanh nghiệp lại nằm ở việc các kỹ sư đang ngày càng giỏi hơn trong việc kết nối các mô hình AI nhỏ, đơn giản để đạt được hiệu quả cao.

Đơn cử, Aurelian – một startup ở Seattle – đã sử dụng AI tạo sinh để tự động phản hồi các cuộc gọi không khẩn cấp tới trung tâm 911. Ở San Francisco, Gong dùng AI để quét và phân tích tất cả cuộc gọi bán hàng của khách hàng nhằm cải thiện doanh số. Airbnb thì sử dụng AI, bao gồm cả các mô hình mã nguồn mở từ Alibaba, để tự động xử lý phần lớn các vấn đề chăm sóc khách hàng nhanh hơn con người.

Ngay cả Meta cũng đang sử dụng các mô hình nhỏ như vậy. Trong cuộc họp báo cáo kết quả kinh doanh gần đây, Giám đốc tài chính Susan Li cho biết, công ty không dùng những mô hình AI lớn nhất để phân phối quảng cáo vì “kích thước và độ phức tạp khiến chi phí quá cao”. Thay vào đó, Meta dùng các mô hình lớn để huấn luyện, rồi chuyển giao kiến thức cho các mô hình nhỏ hơn, nhẹ hơn, chuyên biệt hơn để sử dụng thực tế.

Meta đã sử dụng các mô hình AI nhỏ trong hệ thống phân phối quảng cáo. Ảnh: AP

Điểm chung của các công ty này là đều đã xây dựng được “nhà máy tri thức” nội bộ - nơi mà các mô hình AI nhỏ được nối tiếp nhau như các công đoạn trong dây chuyền.

Nếu trong nhà máy truyền thống, sản phẩm đi qua băng chuyền và được công nhân điều chỉnh dần, thì trong “nhà máy AI”, dữ liệu được luân chuyển qua nhiều tầng phần mềm, và mỗi AI nhỏ lại xử lý, phân loại hay chuyển đổi nó theo một cách khác nhau.

Ở đây, “băng chuyền” là phần mềm thông thường mà các công ty đã phát triển qua nhiều năm, còn “công nhân” là các công cụ AI chạy bằng mô hình ngôn ngữ nhỏ.

Một nhóm nhà nghiên cứu từ Nvidia và Viện Công nghệ Georgia gần đây đã nhận định rằng, sự trỗi dậy của các tác nhân AI đang mở ra “hàng loạt ứng dụng, trong đó các mô hình ngôn ngữ thực hiện lặp đi lặp lại một số nhiệm vụ chuyên biệt với rất ít biến thể”.

Nhóm nghiên cứu kết luận rằng, các mô hình ngôn ngữ nhỏ “đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn” cho những công việc như vậy.

ỨNG DỤNG MÔ HÌNH NGÔN NGỮ NHỎ TRONG THỰC TẾ

Gong – công ty giúp khách hàng tăng doanh số - là một trong những ví dụ tiêu biểu. Nhà đồng sáng lập – ông Eilon Reshef cho biết, khách hàng như Google hay Cisco có thể hỏi hệ thống AI hội thoại những câu như: “Tại sao tôi đang mất đơn hàng?”

Để trả lời, Gong kết hợp giữa các công cụ AI tiên tiến và đắt tiền với những mô hình nhỏ hơn, rẻ hơn. Hệ thống sẽ giao những nhiệm vụ phức tạp hơn cho các mô hình thông minh hơn, giống như người quản lý giao việc tùy theo trình độ của nhân viên.

Phần mềm của Gong bắt đầu bằng cách gửi câu hỏi của người dùng, ví dụ “Vì sao doanh số của tôi giảm?”, đến một trong những mô hình AI tiên tiến của Anthropic hoặc OpenAI. Mô hình này sẽ đưa ra kế hoạch tổng quát để trả lời. Do các mô hình lớn rất đắt và tốn thời gian suy luận, Gong chỉ dùng khi thật sự cần.

Sau đó, hệ thống của Gong tự động khởi động, rà soát hàng chục nghìn cuộc gọi bán hàng đã ghi âm, dùng các mô hình ngôn ngữ nhỏ hơn để tóm tắt nội dung, rồi một mô hình khác sẽ đọc và phân tích những bản tóm tắt đó.

Cuối cùng, tất cả dữ liệu này được đưa trở lại cho mô hình AI lớn để tạo ra một bản báo cáo – bản báo cáo mà trước đây sẽ cần hàng trăm giờ làm việc của con người có chuyên môn.

“Bạn có thể dùng mô hình rẻ nhất để xem cuộc gọi có liên quan không, mô hình trung bình để tìm thông tin quan trọng, rồi mô hình đắt nhất để viết ra tài liệu hành động”, ông Reshef giải thích.

Các mô hình ngôn ngữ nhỏ đủ mạnh, phù hợp tự nhiên và chắc chắn kinh tế hơn khi ứng dụng trong đời sống. Ảnh: Shutterstock

MÔ HÌNH AI DỰA VÀO NGÔN NGỮ NHỎ NHANH HƠN, RẺ HƠN

Sự khác biệt về chi phí giữa các mô hình lớn, phức tạp và các mô hình nhỏ, đơn giản là rất lớn.

Theo ước tính trung bình của ngành, GPT-5 Nano của OpenAI – mô hình nhỏ và nhanh nhất – có giá khoảng 0,1 USD cho mỗi triệu token, trong khi GPT-5 đầy đủ và tiên tiến có giá khoảng 3,44 USD cho cùng số lượng. Token là đơn vị cơ bản mà AI dùng để xử lý văn bản.

Hơn nữa, các mô hình lớn có thể tiêu tốn gấp hàng nghìn lần số token để hoàn thành một tác vụ, vì các mô hình này cần “tự trò chuyện nội tâm” để suy luận ra câu trả lời.

Cần lưu ý rằng “nhỏ và ít thông minh hơn” không đồng nghĩa với “kém hiệu quả hơn”. Các mô hình nhỏ hoàn toàn có thể được tinh chỉnh trong quá trình huấn luyện hoặc thông qua các hướng dẫn chi tiết để trở nên cực kỳ phù hợp với nhiệm vụ cụ thể.

“Các mô hình ngôn ngữ lớn cực kỳ thông minh, nhưng không mang lại cho chúng tôi cách tận dụng dữ liệu độc quyền hoặc để đưa phản hồi của biên tập viên vào hệ thống một cách hiệu quả”, ông Don MacKinnon, Giám đốc điều hành Hark Audio, cho biết.

Nhóm của ông đã xây dựng một thư viện hàng chục nghìn đoạn podcast được chọn lọc và biên tập thủ công, dùng chính dữ liệu này để tinh chỉnh mô hình AI tùy chỉnh có thể tự động hóa toàn bộ quy trình.

Qua trao đổi với nhiều công ty đang sử dụng mô hình nhỏ, có thể thấy họ đều xây dựng hệ thống của theo cách rất giống nhau. Điều đó cho thấy rằng có lẽ chỉ có một số mô hình hoạt động thực sự hiệu quả, và gần như tất cả đều bao gồm các mô hình ngôn ngữ nhỏ.

Từ khóa:

Động thái của Meta phản ánh áp lực ngày càng lớn về năng lượng trong cuộc đua AI toàn cầu

Meta đặt cược vào năng lượng truyền từ không gian để nuôi tham vọng AI

Meta đang theo đuổi một hướng đi đầy tham vọng: khai thác năng lượng mặt trời ngoài không gian để cung cấp điện cho các trung tâm dữ liệu trí tuệ nhân tạo...

14:39 28/04/2026

Mẫu máy chủ AI “made in Vietnam” đã được giới thiệu tại Diễn đàn Kinh tế Việt Nam - Hàn Quốc

Giới thiệu máy chủ AI “made in Vietnam” tại Diễn đàn Kinh tế Việt Nam - Hàn Quốc

Máy chủ AI “made in Vietnam” là sự khẳng định cho bước chuyển từ ứng dụng công nghệ sang sản xuất công nghệ, từ tham gia thị trường sang tham gia chuỗi cung ứng...

10:22 24/04/2026

Amazon công bố thương vụ mua lại Globalstar với giá 11,6 tỷ USD – một bước đi mang tính chiến lược nhằm tăng tốc dự án internet vệ tinh Amazon Leo

Amazon Leo phá thế độc tôn của Internet vệ tinh Starlink tại Đông Nam Á

Sau nhiều năm gần như “một mình một ngựa”, thị trường internet vệ tinh Đông Nam Á đang bước vào giai đoạn cạnh tranh thực sự khi Amazon Leo xuất hiện…

19:47 22/04/2026

Trung Quốc vừa công bố một chiến lược quốc gia quy mô lớn nhằm tích hợp trí tuệ nhân tạo (AI) vào toàn bộ hệ thống giáo dục trước năm 2030.

Trung Quốc công bố chiến lược toàn diện, đưa AI vào lớp học đến năm 2030

Bắc Kinh đặt mục tiêu tích hợp trí tuệ nhân tạo trên toàn hệ thống giáo dục, từ phổ thông đến học tập suốt đời, với trọng tâm cá nhân hóa học tập, hỗ trợ giáo viên và dự báo nhu cầu nhân lực trong tương lai...

13:29 20/04/2026

Một cụm siêu máy tính mới có khả năng xử lý các tác vụ trí tuệ nhân tạo phức tạp nhất trong lĩnh vực khoa học đã chính thức đi vào vận hành

Trung Quốc vận hành cụm siêu máy tính AI4S lớn nhất với 60.000 chip

Trung Quốc vừa đưa vào hoạt động một cụm siêu máy tính chuyên phục vụ “AI cho khoa học” (AI4S) tại tỉnh Hà Nam, đánh dấu bước tiến quan trọng trong chiến lược kết hợp trí tuệ nhân tạo với nghiên cứu khoa học…

07:00 18/04/2026

CEO Nvidia Jensen Huang nhấn mạnh AI là yếu tố thiết yếu để biến điện toán lượng tử trở nên khả thi

Cổ phiếu lượng tử bùng nổ nhờ “cú hích” AI từ Nvidia

Làn sóng tăng giá mạnh mẽ của các cổ phiếu điện toán lượng tử đang thu hút sự chú ý của giới đầu tư toàn cầu...

17:43 17/04/2026

Sức khỏe thương hiệu của các ngân hàng Việt hiện nay đang được định nghĩa lại qua khả năng ứng dụng AI và ESG

AI và ESG đang "định hình lại" sức khỏe thương hiệu của các ngân hàng Việt

Sức khỏe thương hiệu của các ngân hàng Việt đang được dịch chuyển qua khả năng ứng dụng AI (Trí tuệ nhân tạo) để chuyển hóa trải nghiệm số thành hành vi sử dụng thực tế và thực thi chiến lược ESG (Môi trường - Xã hội - Quản trị) nhằm tạo dựng niềm tin bền vững, thay vì chỉ dựa vào mức độ nhận biết đơn thuần…

17:40 17/04/2026

Công nghệ tiên tiến giúp nâng cao hiệu suất, tính linh hoạt, giảm khoảng 20% số lần thử nghiệm và đưa sản phẩm ra thị trường nhanh hơn.

Ứng dụng công nghệ bản sao số, AI vào ngành công nghiệp làm đẹp

Các doanh nghiệp làm đẹp đang tìm cách tận dụng công nghệ mô phỏng và trí tuệ nhân tạo để rút ngắn chu kỳ đổi mới trong bối cảnh cạnh tranh ngày càng gia tăng...

16:36 16/04/2026

Các chatbot trí tuệ nhân tạo (AI) dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa

Chatbot AI chẩn đoán sai trong hơn 80% trường hợp bệnh án ban đầu

Nghiên cứu được công bố trên tạp chí JAMA Network Open, dựa trên việc kiểm tra 21 mô hình AI khác nhau cho thấy các chatbot AI dành cho người tiêu dùng đang bộc lộ những hạn chế đáng kể khi được sử dụng để hỗ trợ chẩn đoán y khoa...

13:57 15/04/2026

Meta đang xây dựng phiên bản AI của chính CEO Mark Zuckerberg

Meta xây dựng “bản sao AI” của CEO Mark Zuckerberg để tương tác với nhân viên

Meta đang phát triển phiên bản "Mark Zuckerberg AI" có khả năng giao tiếp trực tiếp với nhân viên. Đây là một phần trong chiến lược lớn hơn nhằm tái định hình tập đoàn xoay quanh AI và tham vọng “siêu trí tuệ cá nhân”...

14:45 14/04/2026