fbpx
ĐĂNG KÝ HỌC THỬ MIỄN PHÍ NGAY

Chúng ta mong đợi gì từ AI trong năm 2024, Podcast cùng với Craig S. Smith

Richie và Craig đang nói về những tiến bộ năm 2023 trong lĩnh vực AI trí tuệ nhân tạo tổng hợp, tương lai đầy hứa hẹn của các mô hình thế giới và tác nhân AI, tiềm năng biến đổi của AI trong nhiều lĩnh vực khác nhau, v.v.

Sự xuất hiện của công nghệ AI Trí tuệ Nhân tạo đã giúp con người giải quyết nhiều khó khăn trong cuộc sống, đặc biệt là thời đại 4.0. Hiện nay, vai trò của AI ngày càng quan trọng hơn bao giờ hết. Điều này đặt ra câu hỏi: AI mang lại những lợi ích gì và liệu rằng có có ảnh hưởng hay thay đổi như thế nào trong năm 2024? Để giải đáp thắc mắc đó, NativeX mang đến thông tin chi tiết hơn, thông qua cuộc trò chuyện của Richie và Craig.

Dự đoán AI sẽ càng phát triển trong năm 2024 và trong tương lai

“Khi bạn nghĩ về nó, hãy nghĩ về những gì một mô hình ngôn ngữ lớn đang làm. Nó có một chuỗi văn bản và đang dự đoán phần tiếp theo trong chuỗi đó. Và điều đó thật tuyệt vời. Nhưng nó không hiểu được thực tế cơ bản mà đoạn văn mô tả. Còn một mô hình thế giới sẽ hoặc đã hiểu được.”

“Đã có rất nhiều cuộc nói chuyện về trí thông minh và siêu trí tuệ. Ý tôi là, Sam Altman đã đưa ra một số nhận xét với FT về việc lập kế hoạch cho GPT-5, điều này xảy ra trước khi ông ấy bị sa thải khỏi OpenAI, và điều đó đã tạo ra rất nhiều cuộc thảo luận về siêu trí tuệ sẽ ra mắt vào năm tới hoặc điều gì đó. Bạn biết đấy, sự tiến bộ hướng tới siêu trí tuệ và AGI. Tôi nghĩ điều đó sẽ xảy ra, nhưng tôi không nghĩ chúng ta đang đi đúng hướng để đạt được điều đó. Tôi nghĩ rằng nó còn rất xa và mọi người không nên mong đợi hay lo lắng về nó vào lúc này. Các mối đe dọa hiện nay là những thứ như tác nhân có thể truyền bá thông tin sai lệch với giá rẻ. Nhưng siêu trí thông minh và AGI, đối với tôi, còn hàng thập kỷ nữa mới có.”

Cuộc cách mạng AI
Cuộc cách mạng AI: Những kỳ vọng và thách thức cho năm 2024

Những điểm Quan trọng

  1. Hiểu rõ về khả năng và rủi ro của các tác nhân Trí tuệ Nhân tạo (AI), đặc biệt là tự động hóa quy trình làm việc và có thể truyền bá thông tin sai lệch, để tận dụng lợi ích của chúng đồng thời giảm thiểu các mối lo ngại về đạo đức.
  2. Trau dồi kiến thức và kỹ năng về AI, không nhất thiết là viết mã hoặc thuật toán, mà là sử dụng hiệu quả các công cụ AI và hiểu được ý nghĩa của chúng trong lĩnh vực của bạn, để duy trì tính cạnh tranh trong bối cảnh AI đang phát triển nhanh chóng.
  3. Tìm hiểu về World models, một công nghệ AI mới nổi, học trực tiếp từ dữ liệu thế giới thực, thể hiện chính xác hơn về thực tế, có khả năng cách mạng hóa lĩnh vực như lái xe tự động và robot.

 

NativeX – Học tiếng Anh online toàn diện “4 kỹ năng ngôn ngữ” cho người đi làm.

Với mô hình “Lớp Học Nén” độc quyền:

  • Tăng hơn 20 lần chạm “điểm kiến thức”, giúp hiểu sâu và nhớ lâu hơn gấp 5 lần.
  • Tăng khả năng tiếp thu và tập trung qua các bài học cô đọng 3 – 5 phút.
  • Rút ngắn gần 400 giờ học lý thuyết, tăng hơn 200 giờ thực hành.
  • Hơn 10.000 hoạt động cải thiện 4 kỹ năng ngoại ngữ theo giáo trình chuẩn Quốc tế từ National Geographic Learning và Macmillan Education.

ĐĂNG KÝ NATIVEX

Podcast cùng với Craig S. Smith về sự ảnh hưởng của AI trong năm 2024

Richie Cotton: Chào mừng các bạn đến với DataFramed. Tôi là Richie. Khi chúng ta sắp khép lại năm 2023, mọi người đều đồng ý một chuyện, đây là khoảng thời gian phổ biến nhất của AI. Hôm nay chúng ta sẽ dành một chút thời gian, để suy ngẫm về những gì vừa xảy ra và đoán xem, sắp tới sẽ có gì bất ngờ. Tất nhiên, AI đang phát triển nhanh chóng, nhưng ngoài ra, AI cũng đang thay đổi cách chúng ta tương tác với những phần mềm khác và đối với thế giới.

Nó có ảnh hưởng đến sự nghiệp, nền kinh tế và xã hội nói chung. Điều quan trọng, là phải hiểu AI sẽ có ảnh hưởng như thế nào trong năm 2024. Khách mời của chúng ta là Craig Smith, người dẫn chương trình podcast Eye on AI nổi tiếng. Trước đây, ông đã dành hơn ba thập kỷ làm nhà báo và quản lý tại Wall Street Journal, New York Times và các ấn phẩm khác, đưa tin từ hơn 40 quốc gia.

Vì anh luôn theo dõi tin tức thường xuyên, tôi rất muốn nghe nhận định của anh về AI, và hướng phát triển sắp tới của nó. Chào buổi sáng, Craig. Rất vui được chào đón bạn trong chương trình.

Trước hết tôi muốn nói về những gì đã xảy ra năm ngoái. Và tôi nghĩ thực sự 2023 đã là một năm đột phá đối với AI sáng tạo. Và, anh cảm thấy điều gì đã tạo ra ảnh hưởng lớn nhất cho đến nay?

Craig Smith: Nó đánh vào nhận thức của công chúng, tôi cho rằng anh và tôi, đều liên quan đến AI và theo dõi AI trong nhiều năm. Và tôi đã nói chuyện với gia đình và các con tôi, tôi nói với họ rằng, hãy chú ý đến điều này, chú ý vào điều này. Và mọi người đều trợn mắt nhưng cuối cùng đã hiểu.

Tôi đã có cuộc trò chuyện với Aiden Gomez cách đây không lâu. Anh ấy là người đồng sáng lập Công ty Cohare, một trong những công ty LLM lớn. Và anh ấy ở trong nhóm viết thuật toán transformer tại Google, đó là cốt lõi của tất cả các mô hình AI tổng hợp này. Anh ấy nói rằng họ đã tạo ra thuật toán này, nó đã làm được những điều tuyệt vời, nhưng sau đó chẳng có gì xảy ra cả, và họ không thể tin được.

Họ tự hỏi, “Khi nào mọi người sẽ nhận ra những gì chúng tôi đã làm?” Và thành thật mà nói, Open AI và Microsoft đã phải đầu tư tiền vào tính toán và mở rộng quy mô, để nó thu hút sự tưởng tượng của công chúng. Vì vậy, vâng, tôi nghĩ rằng việc đánh trúng trí tưởng tượng của công chúng, mới là điều quan trọng nhất. Và chắc chắn là GPT-4.

Quy mô của GPT-4 là một bước tiến lớn. Và sau đó tất cả các công ty mô hình ngôn ngữ lớn khác đều tham gia vào như: Anthrop, Coha và Facebook hoặc Meta với Lama, với mô hình nguồn mở và mọi thứ đã xảy ra, tôi biết. Tất cả đều đóng góp vào việc nâng cao nhận thức của công chúng.

Richie Cotton: Hoàn toàn đúng. Tôi đã nhận thấy sự thay đổi so với vài năm trước. Anh nói “Ồ, tôi đang làm việc với những người làm AI,” mọi người chỉ trợn mắt, nhưng bây giờ nó như là một điều tự nhiên.

Craig Smith: Đúng vậy. Mọi người, đúng vậy. Mọi người đều chú ý.

Richie Cotton: Chắc chắn rồi. Và anh có bất kỳ ứng dụng nào của công nghệ mà mình yêu thích không?

Craig Smith: Chà, về mặt cá nhân, vì tôi viết rất nhiều nên tôi sử dụng nó cho nghiên cứu, tôi sử dụng binging, hoặc phiên bản trình duyệt của ChatGPT, vì nó giúp tăng tốc quá trình nghiên cứu của bạn, bạn có thể đặt câu hỏi bằng ngôn ngữ tự nhiên. Nó sẽ quay lại với một câu trả lời được chú thích ở cuối trang và sau đó bạn có thể sử dụng những câu trả lời đó.

Tiết kiệm rất nhiều thời gian và công sức trong nghiên cứu. Và sau đó tôi cũng sử dụng nó để tóm tắt, tôi có thể chọn và sao chép các bài viết khác nhau, yêu cầu các đầu mục chi tiết. Điều này giúp tăng năng suất hơn. Đã có một vài trường hợp tôi tin tưởng nó quá nhiều. Một lần tôi đã viết cho Forbes.

Điều này là, tháng 2 hay gì đó, và sau khi tôi đăng nó lên Forbes thì tôi nhận ra rằng nó đã bịa đặt, Và may mắn là nó chỉ hoạt động được vài phút, nhưng, sự thật, đối với tôi, đó thực sự là khía cạnh của tiết kiệm thời gian. Tôi không sử dụng nó để viết hoặc thực hiện những công việc sáng tạo hơn, mặc dù khi bạn gửi cho tôi một số câu hỏi về việc tạo hình ảnh.

Tôi không sử dụng tính năng tạo hình ảnh nhiều, nhưng khi tôi viết cho các trang web yêu cầu cung cấp hình ảnh, tôi chủ yếu sử dụng mid journey để tạo ra hình ảnh, và đó là một sự tiết kiệm thời gian rất lớn. Và thành thật mà nói, nếu tôi là một họa sĩ đồ họa, điều này có thể làm tôi sợ hãi. Tôi chắc chắn rằng nó đang ảnh hưởng đến hoạt động kinh doanh của họ.

sự ảnh hưởng của AI

Richie Cotton: Hoàn toàn đúng. Đúng vậy, nhiều tác động và tôi muốn thảo luận đối với nền kinh tế và việc làm sau này. Nhưng vâng, tôi thích ngay cả những công việc đơn giản như việc tóm tắt tài liệu, chúng cực kỳ tiết kiệm thời gian và quan trọng.

Craig Smith: Và vì điều đó, tôi không biết người nghe đã tìm hiểu nhiều với các mô hình này chưa. Nhưng trong số những cái tôi đã chơi hoặc sử dụng, có hai mô hình có cửa sổ ngữ cảnh lớn nhất. Bạn có thể tải lên khối văn bản lớn. Vì vậy, tôi sử dụng nó rất nhiều. Tôi nghĩ rằng ChatGPT vẫn bị ràng buộc về lượng văn bản bạn có thể tải lên để tóm tắt. Nhưng, tất cả những vấn đề đó sẽ được giải quyết theo thời gian.

Richie Cotton: Đúng vậy. Những loại cửa sổ ngữ cảnh lớn hơn này khá hữu ích. Trên thực tế, có lẽ chúng ta có thể đi sâu vào vấn đề này chi tiết hơn một chút. Vì vậy, tôi nghĩ có lẽ những mô hình ngôn ngữ lớn là câu chuyện đáng bàn nhất về AI tổng hợp, cho đến nay vào năm 2023. Anh có nghĩ điều đó sẽ tiếp tục như vậy hay không, và anh nghĩ chúng sẽ thay đổi như thế nào trong năm 2024?

Craig Smith: Tôi đã chú ý rất nhiều đến các mô hình thế giới, đó là một loại mô hình khác không phụ thuộc vào ngôn ngữ để học. Và tôi nghĩ rằng các mô hình thế giới sẽ là một hướng đi mới quan trọng trong lĩnh vực AI và AI sáng tạo. Nói chung, chúng vẫn là mô hình sáng tạo. Và tôi cũng nghĩ rằng chúng áp dụng cho những agents, AI agents từ khi GPT-3 xuất hiện lần đầu.

Có cái gọi là AutoGPT xuất hiện trên GitHub, nơi ai đó đã xây dựng một trình bao bọc. Xung quanh GPT thì sẽ có hành động. Nhưng hiện nay OpenAI đã tung ra các agents. Và tôi nghĩ rằng đó thực sự sẽ là hướng tiếp theo với các mô hình ngôn ngữ lớn. Vì vậy, bạn có thể yêu cầu một mô hình ngôn ngữ lớn hoặc cắm mô hình ngôn ngữ lớn vào AI agents, để sau đó sẽ thực hiện hành động.

Và, cuối cùng, bạn sẽ có khả năng tự động hóa toàn bộ quy trình làm việc từ đầu đến cuối. Hiện nay, bạn hỏi một mô hình ngôn ngữ lớn một câu hỏi, bạn nhận được một câu trả lời, và sau đó bạn phải tìm cách xử lý câu trả lời đó. Nhưng tôi nghĩ rằng các agents sẽ thay đổi nền kinh tế toàn cầu, anh biết đấy.

Richie Cotton: Chắc chắn. Tôi nghĩ vậy, có hai công nghệ quan trọng ở đây. Có lẽ chúng ta sẽ bắt đầu với các mô hình thế giới. Thực sự, đó là điều mà tôi chưa quen lắm. Vì vậy, anh có thể giải thích, những mô hình này được sử dụng để làm gì không?

Craig Smith: Đúng vậy, vì vậy, Yann LeCun đã tập trung vào các mô hình thế giới, từ một khoảng thời gian rất lâu. Và bây giờ tôi không phải là một học viên, nên tôi sẽ không giả vờ hiểu mọi thứ về họ. Nhưng cơ bản, mô hình ngôn ngữ lớn dự đoán từ tiếp theo trong một chuỗi. Và từ đó có thể là một từ hoặc một phần của một từ. Nó vẫn tiếp tục tiến triển.

Các mô hình nhận diện các mẫu trong ngôn ngữ mà chúng đã được đào tạo, nhưng toàn bộ kiến thức của chúng, và điều này liên quan đến cuộc tranh luận về trí tuệ, được chứa trong ngôn ngữ con người và văn bản, thật đáng kinh ngạc vì nó chứa rất nhiều thông tin sai lệch, rất nhiều thông tin cũ. Do đó, khi mô hình dự đoán từ hoặc từ tiếp theo, nó thực hiện dựa trên xác suất của từ đó sẽ là gì.

Và nó thực hiện công việc đáng tin cậy. Nó tạo ra những phản hồi thông minh, phức tạp rất có hiểu biết. Nó hiểu được châm biếm, thơ ca và đến một mức độ nào đó là mã máy tính. Tuy nhiên, nó dựa trên xác suất. Tôi nghĩ rằng trong tưởng tượng của công chúng, điều này đã làm cho nhiều người bối rối vì nó trông giống như trí thông minh.

Và tôi biết rằng có những người thông minh hơn tôi rất nhiều, cho rằng đó là ở một dạng trí thông minh nào đó. Nhưng vấn đề là dù xác suất cao nhất là gì, nó sẽ xuất hiện, và đó là lý do tại sao nó sẽ tưởng tượng ra điều gì đó nếu không có một từ tiếp theo rõ ràng. Điều đó có thể không chính xác về mặt thực tế trong cuộc sống, vì nó không có sự liên kết, mà chỉ dựa trên văn bản nó đã được đào tạo, cách xa với thực tế.

Các mô hình thế giới được đào tạo trực tiếp trên dữ liệu đầu vào từ thực tế mà không phụ thuộc vào ngôn ngữ. Và cách nhanh nhất để làm điều đó là thông qua video. Yan LeCun đã có những tiến bộ đáng kể trong lĩnh vực này. Mô hình nhìn vào một cảnh, và thay vì dự đoán điều gì sẽ xảy ra trong cảnh tiếp theo, nó mã hóa sự thể hiện của cảnh đó trong một chiều không gian cao hơn và sau đó, nó hoạt động trong chiều không gian đó.

Vì vậy, nếu bạn đang nhìn vào một cảnh trên đường, điều này được sử dụng bởi một công ty có tên là Wave AI, WAY AI, có mô hình thế giới riêng của họ. Nó đã làm những điều tuyệt vời. Nó sẽ nhìn vào khung cảnh đường phố chứ không phải khi nào nó mã hóa cảnh đó thành một hình ảnh chi tiết cao hơn.

Không quan trọng màu sắc là gì. Thực tế, trong một số trường hợp, có thể màu sắc quan trọng, nhưng tất cả các chi tiết tinh tế ở cấp độ điểm ảnh đều biến mất. Nó chỉ là một sự biểu diễn cho phép thực hiện mô hình đó. Những dự đoán về những gì sẽ xảy ra hoặc hiểu được, chẳng hạn như các định luật vật lý, trong khi ở mô hình ngôn ngữ lớn, việc hiểu các định luật vật lý đến từ các mô tả về các định luật vật lý trong văn bản.

Trong mô hình thế giới, nó học các định luật vật lý bằng cách chứng kiến cách thế giới vật chất vận hành, và đó là một sự thể hiện rất mạnh mẽ, cơ bản hơn nhiều so với thông qua ngôn ngữ, một biểu diễn cụ thể hơn nhiều. Bất kỳ ai quan tâm đến điều này, trước hết nên chú ý đến Yann LeCun, người đã phát triển vấn đề này và xem Wave AI đã làm được những gì.

Chúng ta đã thấy tất cả các video tạo ra từ các mô hình lớn, chủ yếu là các mô hình ngôn ngữ. Chúng đang dự đoán pixel tiếp theo thay vì mã thông báo tiếp theo. Nhưng hãy xem Wave AI đã làm gì trong việc tạo ra cảnh đường phố trong LLM. Mọi thứ đều nhòe và Wave AI với mô hình thế giới của mình, mô hình được gọi là Gaia One, nó tạo ra video rất ổn định, rất thực tế. Điều này thực sự là đáng chú ý. Wave AI đang sử dụng như mô hình chính trong hệ thống lái xe tự động của mình và có rất nhiều ứng dụng khác. Tôi nghĩ rằng sẽ có những mô hình dựa trên thực tế vật lý nhiều hơn.

Và tôi nghĩ rằng trong tương lai, bạn sẽ kết hợp mô hình thế giới và mô hình ngôn ngữ vì nó rất giống cách con người học, một đứa trẻ học thông qua việc quan sát thế giới vật lý và sau khi hiểu về thế giới vật lý, nó bắt đầu học các khái niệm cấp cao hơn thông qua ngôn ngữ.

Vì vậy, tôi nghĩ rằng mô hình thế giới là một lĩnh vực nghiên cứu thực sự hứa hẹn.

Richie Cotton: Điều đó thực sự rất hấp dẫn. Và tôi chắc chắn có thể nhìn thấy bất cứ khi nào bạn làm bất cứ điều gì liên quan đến không gian, bạn sẽ muốn có một loại mô hình vật lý cơ bản đang diễn ra. Vì vậy, đúng, nó có thể rất lớn đối với bất kỳ loại sản xuất hoặc kỹ thuật nào. Thậm chí như việc dự đoán những điều đang diễn ra trong các trò chơi thể thao.

Đó là mô hình thế giới. Chắc chắn có điều gì đó cần chú ý. Một điều khác anh đã đề cập trước đó là các tác nhân trí tuệ nhân tạo. Vậy nên, hãy nói cho tôi biết những điều này sẽ có tác động như thế nào.

Craig Smith: Vâng, và điều này, khi GPT-3 lần đầu tiên ra mắt đã có rất nhiều lo lắng, vẫn còn rất nhiều lo lắng về khả năng của những mô hình này có thể làm được, và những điều xấu mà chúng có thể bị lạm dụng. Một trong những lo ngại là bạn có thể sử dụng một mô hình ngôn ngữ lớn.

ChatGPT có một plugin với Zapier, hoặc Zapier có một plugin và tích hợp với ChatGPT. Tôi không nhớ nó hướng nào, nhưng Zapier là một tác nhân, nó có thể thực hiện các hành động. Vì vậy, nếu bạn muốn nó gửi một email. Nó có thể gửi email mà bạn muốn, đăng nội dung nào đó lên mạng xã hội.

Nó có thể đăng một cái gì đó trên trò chuyện mạng xã hội. Riêng GPT hoặc một trong những LLM lớn không thể làm được điều đó. Chúng không thực hiện hành động.

Mọi người đã bắt đầu thiết kế các trình bao bọc tác nhân này, thực tế là như Auto GPT, bạn có thể truy vấn hoặc gửi câu hỏi cho LLM, sau đó tác nhân sẽ lấy kết quả từ LLM và thực hiện bất kỳ điều gì bạn đang yêu cầu nó làm. Và có nhiều lo ngại rằng, các tác nhân sẽ cho phép những đối tượng xấu thực hiện những hành động khủng khiếp.

Ý tôi là, bạn đã có một cuộc gọi gần đây với một công ty có tên NewsGuard theo dõi thông tin sai lệch trên Internet, và bạn không còn cần một người nữa nhắc LLM, tạo ra một số văn bản và sau đó chặn, sao chép, dán nó vào một trang web. Những tác nhân này có thể thực hiện tất cả mọi thứ đó.

Bạn có thể thiết lập trong đó, bạn có thể thiết lập hàng nghìn tác nhân và chúng có thể, tạo ra thông tin sai lệch và đăng nó lên mạng xã hội hoàn toàn tự động. Nhưng cũng có những điều tuyệt vời khác mà các tác nhân có thể làm. Những điều tốt. Và, bảng điều khiển nhiệt độ của bạn chính là một tác nhân.

Bạn thiết lập bảng điều khiển, và khi nhiệt độ giảm xuống dưới một mức nhất định, bảng điều khiển sẽ bật lên. Đó là tính chất hành động, và với sức mạnh của một mô hình ngôn ngữ lớn, bạn sẽ có những tác nhân có khả năng xử lý toàn bộ quy trình làm việc, khi tôi còn làm việc cho New York Times, họ có hệ thống đòi hỏi cho việc thanh toán chi phí, và nó thật khó chịu.

Tôi phải đợi. Vậy nên, sau 6 tháng, tôi sẽ dành đúng một tuần để gõ vào những ô nhỏ này, mọi thứ đều rối bời và bạn có thể mất dữ liệu, bạn biết đấy, những tác nhân sẽ có khả năng thực hiện tất cả những điều đó chỉ với một bộ hướng dẫn đơn giản. Vì vậy, tôi nghĩ những tác nhân. Liên quan đến LLMs, sẽ có một tác động to lớn đối với nền kinh tế và điều đó đang bắt đầu xảy ra.

Richie Cotton: Có nhiều điều cần thảo luận ở đây. Và tôi phải nói rằng, tôi hiểu cảm giác khó chịu khi làm chi phí. Một trong những điều tuyệt vời về AI là nó có thể tự động lấy ra các con số từ một bức ảnh, biên lai hay thứ gì đó. Đó là điều tuyệt vời. Nhưng tôi thích những gì bạn nói về hệ thống sưởi ấm, chỉ cần bảng điều khiển nhiệt độ thông thường trong nhà cũng là trí tuệ nhân tạo thực sự.

Và đúng, điều quan trọng là, nói chung, bạn không cần một máy tính để làm AI. Chỉ cần là một thứ gì đó có thể lấy dữ liệu, đưa ra quyết định. Vì vậy, một điều anh cũng đề cập đến là thông tin sai lệch. Tôi đoán rằng đây có lẽ là một vấn đề rất quan trọng với anh như một nhà báo.
Liệu anh có thể giải thích cho tôi về những thông tin sai lệch mà anh nghĩ sẽ xảy ra, cũng như cách nó sẽ diễn ra trong năm tới được không?

Craig Smith: Chúng ta đều biết rằng thông tin sai lệch đã xuất hiện trong cộng đồng từ lâu và tạo ra nhiều vấn đề, đặc biệt là trong hệ thống chính trị ở Mỹ. Chúng ta đã thấy thông tin sai lệch thực sự có ảnh hưởng trong chu kỳ bầu cử tổng thống trước đó. Chúng ta đang tiến vào một giai đoạn mới. Và nó sẽ mạnh hơn rất nhiều.

Hiện tại nó đang có tác động đến cuộc trò chuyện công bố xã hội về xung đột giữa Israel và Hamas, và hiện không nhiều ở Hoa Kỳ, nhưng NewsGuard đã cho tôi xem một ví dụ về một bài báo được viết bởi mô hình ngôn ngữ lớn về việc bác sĩ tâm thần của Bibi Netanyahu tự tử.
Và bác sĩ tâm thần này không tồn tại. Nhưng bài viết cực kỳ thuyết phục. Họ đã tạo ra một trang web như Global News Outlook hoặc một cái tên chung chung như vậy. Và đăng bài viết trên trang web đó cùng với nhiều thông tin khác. Bài viết cho biết rằng, bác sĩ tâm lý của Netanyahu cảm thấy thất vọng với những gì họ gọi là “lời dối trá của Netanyahu” nên đã tự tử.

Tôi nghĩ những người có trình độ học vấn trung bình sẽ nhận ra rằng trang web không đáng tin cậy và câu chuyện là quá mức phức tạp. Nhưng câu chuyện đó đã được đài truyền hình nhà nước Iran chọn lại và chiếu qua nhiều đợt tin tức. Và, điều đó thật nguy hiểm. Và khi các agents hoạt động, lượng thông tin sai lệch như vậy sẽ tăng vọt.

Và câu hỏi là liệu có các hệ thống đã được thiết lập để theo dõi tất cả điều này hoặc giáo dục công dân về cách nhận biết thông tin đáng tin cậy hay không. Vì vậy, tôi nghĩ rằng thông tin sai lệch là một điều đã có ảnh hưởng đáng kể đối với cuộc trò chuyện cộng đồng ở Hoa Kỳ và ở nhiều nơi khác trên thế giới.

Nhưng tôi nghĩ những gì chúng ta đã thấy chỉ là trò chơi trẻ con so với điều chúng ta sẽ phải đối mặt trong 10 năm tới.

Dự đoán sự phát triển của AI

 

NativeX – Học tiếng Anh online toàn diện “4 kỹ năng ngôn ngữ” cho người đi làm.

Với mô hình “Lớp Học Nén” độc quyền:

  • Tăng hơn 20 lần chạm “điểm kiến thức”, giúp hiểu sâu và nhớ lâu hơn gấp 5 lần.
  • Tăng khả năng tiếp thu và tập trung qua các bài học cô đọng 3 – 5 phút.
  • Rút ngắn gần 400 giờ học lý thuyết, tăng hơn 200 giờ thực hành.
  • Hơn 10.000 hoạt động cải thiện 4 kỹ năng ngoại ngữ theo giáo trình chuẩn Quốc tế từ National Geographic Learning và Macmillan Education.

ĐĂNG KÝ NATIVEX

Richie Cotton: Chắc chắn rồi. Và điều đó nói lên một điểm thú vị rằng, bạn có một trang web không đáng tin cậy đưa ra thông tin sai lệch, nhưng sau đó một khi nó được truyền thông bởi một trang web có uy tín hơn như Đài Tin tức Quốc gia, thì thông tin đó sẽ có một chút uy tín.

Craig Smith: Vâng, đúng vậy. Đúng vậy.

Richie Cotton: Và tôi cho rằng, chúng ta đã bàn về ảo tưởng và những LLM bịa đặt ra, mọi thứ là một vấn đề, nhưng có vẻ như một số người thực sự muốn có khả năng bịa ra mọi thứ.

Vậy nên tôi không biết. Bạn có giải pháp không? Bạn nghĩ vấn đề về ảo tưởng sẽ trở nên tốt hơn hay tồi tệ hơn trong năm tới?

Craig Smith: Tôi nghĩ rằng các mô hình ngôn ngữ lớn có thể chế ngự được chúng. Chiến lược hiện tại là thông qua một thứ gọi là học tăng cường với phản hồi của con người. Và hiện nay có rất nhiều nghiên cứu về học tăng cường bằng phản hồi AI. Vì vậy, không cần con người tham gia để đào tạo những mô hình này.

Một mô hình ngôn ngữ lớn giống như tôi. Tôi là một người già. Tôi đã đọc rất nhiều thứ. Và nếu bạn hỏi tôi chuyện gì đã xảy ra trong bữa tiệc sinh nhật của mẹ tôi 30 năm trước. Bạn biết đấy, tôi sẽ nhớ, hoặc có thể không, nhưng tôi sẽ nói với bạn điều gì đó. Và nhiều phần của nó sẽ không chính xác.

Nếu bạn có thể quay ngược cuộn băng về 30 năm trước và xem lại đoạn video về bữa tiệc sinh nhật đó, sẽ có rất nhiều chi tiết sai. Tôi có thể có sai lầm về người nào đã tham gia. Tôi có thể quên đồ ăn được phục vụ hoặc tất cả những chi tiết đó. Hoặc thậm chí tôi sai toàn bộ sự kiện, sai ngày tháng.

Các mô hình ngôn ngữ lớn cũng giống như vậy. Thông tin có sẵn, nhưng nó chỉ đưa ra phản hồi dựa trên xác suất, và nếu nó không có một giải pháp tốt theo xác suất, nó chỉ đơn giản là bịa chuyện, và, như chúng ta đều biết, nói về những điều này với một giọng điệu như thật.

Vì vậy, cách mà tất cả các công ty mô hình ngôn ngữ lớn đang cố gắng khắc phục, là họ có đội ngũ nhân lực rất lớn, theo đúng nghĩa đen. Ở các mức lương khác nhau, tùy thuộc vào mức độ phản hồi phức tạp mà họ đang thực hiện, tôi đã thấy những nền tảng này, một số trong số chúng chi tiết hơn so với những nền tảng khác, trong đó thực sự chỉ là một lượt “thích” hay “không thích”, và bạn sẽ thấy những nơi mà nhiều người dùng của các mô hình ngôn ngữ lớn đang tham gia, bạn sẽ biết đây có phải là một câu trả lời tốt hay không. Và, những hệ thống này là mô hình ngôn ngữ, có một giao diện sẽ nhận được phần thưởng nếu đó là câu trả lời hay, nếu đó là một câu trả lời sai, nó sẽ bị phạt, không phải theo nghĩa đen hay bóng, mà là trong mã máy tính, thông qua việc người ta chọn “thích” hay “không thích” hoặc chọn câu trả lời tốt nhất trong số các câu trả lời.

Hy vọng là mô hình sẽ học cách ứng xử tốt hơn, đưa ra những câu trả lời chính xác hơn. Nhưng nếu bạn trò chuyện với những nhà nghiên cứu đằng sau điều này, họ không biết liệu điều đó sẽ xảy ra hay không. Ý tôi là, những mô hình này phức tạp đến mức bạn không thể theo dõi các mô đun neural trong mạng. Bạn chỉ có hy vọng, và sau đó họ nói rằng, đúng, chúng đang trở nên tốt hơn nhờ kiểu đào tạo này.

Đối với tôi, điều đó có vẻ vô cùng kém hiệu quả và vô lý khi bạn mong đợi rằng cuối cùng mô hình này sẽ hiểu rằng nó không nên bịa chuyện. Cách tốt hơn để ngăn chặn những ảo tưởng, mà hầu hết các hệ thống doanh nghiệp đòi hỏi độ chính xác đang sử dụng, là xây dựng cơ sở dữ liệu vector bằng Ground truth hoặc thông tin đáng tin cậy được vector hóa, biến mỗi câu thành một chuỗi số.

Đó là ý nghĩa của một vector. Sau đó, mô hình truy vấn cơ sở dữ liệu vector để lấy câu trả lời. Nó có thể bổ sung thông tin và chắc chắn sau đó hoạt động như một trình tạo ngôn ngữ, nhưng thông tin của nó đến từ nguồn đáng tin cậy trong cơ sở dữ liệu vector. Và ngày nay, đó là cách mà vấn đề này đang được giải quyết.

Richie Cotton: Đó là một ý tưởng thú vị để ngăn chặn hiện tượng ảo tưởng, anh thực sự cần công nghệ thứ hai này, những cơ sở dữ liệu vector, và tôi hoàn toàn đồng ý với điều này, tôi đang tự hỏi, vào lúc này, việc phải học một công nghệ bổ sung có vẻ là một trở ngại khi muốn công chúng đón nhận rộng rãi hơn, anh nghĩ điều đó có thể xảy ra không?

Thay đổi trong năm tới? Anh nghĩ liệu việc sử dụng thông tin thực tế trong tài liệu và trợ giúp sẽ trở nên dễ dàng hơn không?

Craig Smith: Vâng, tôi nghĩ, đúng vậy, không phải ai cũng có thể xây dựng một cơ sở dữ liệu vector. Tôi nghĩ đối với công chúng, mọi người chỉ cần học, chẳng hạn như Bing chat, ví dụ như tìm kiếm gắn liền chú thích. Công chúng sẽ cần học cách hỏi ChatGPT để viết một bài thơ nhẹ nhàng hoặc một bài thơ tặng bạn gái chẳng hạn.

Nhưng nếu bạn đang xử lý thông tin thực tế, bạn cần sử dụng một trong những hệ thống gắn liền với tìm kiếm cung cấp cho bạn các nguồn có chú thích ở cuối trang. Sau đó, bạn cần kiểm tra nguồn thông tin. Bạn không thể tin tưởng rằng LLM thực sự cung cấp thông tin chính xác, ngay cả khi nó trích dẫn nguồn.

Và tôi đã gặp phải nhiều trường hợp như vậy, tôi nghĩ rằng Bing Chat đã đưa ra câu trả lời, tôi nhìn thấy nguồn, nhưng sau đó có điều gì đó không đúng trong các câu trả lời, và khi tra cứu và thì nó không chính xác. Vậy nên, công chúng chỉ cần hiểu rằng đây chỉ là các công cụ.

Chúng không phải là bộ não mà bạn có thể tin tưởng. Như tôi đã nói, đó giống như nói chuyện với một người già. Họ có rất nhiều kiến thức, nhưng họ thường bị nhầm lẫn và quên nhiều điều. Bạn không thể chỉ tin tưởng vào đó.

Richie Cotton: Chắc chắn rồi. Tôi bắt đầu nghĩ đến ẩn dụ của anh, rằng khi bạn già, bạn ngày càng giống những mô hình ngôn ngữ lớn này, là khá chính xác. Tôi đoán một điều nữa là cửa sổ ngữ cảnh của anh cũng có xu hướng rút ngắn lại một chút. Anh bắt đầu quên mất một số điều. Anh có muốn cho tôi biết thêm một chút về những liên kết với cửa sổ này, như dung lượng bộ nhớ mà một mô hình ngôn ngữ lớn đã có, thực tế sẽ thay đổi như thế nào không?
Điều đó sẽ ảnh hưởng đến mọi thứ như thế nào?

Craig Smith: Vâng, điều này cũng thú vị. Ngữ cảnh, khi đó, ý tôi là, chắc chắn họ có thể làm cho nó lớn hơn, và họ có thể đào sâu ký ức mà những mô hình này có về cuộc trò chuyện đã diễn ra trong một phiên. Vấn đề thực tế, lý do vì sao có nhiều cuộc thảo luận về việc áp dụng doanh nghiệp, khi có nhiều ứng dụng đang truy cập hộp thư đến của bạn, có một hạn chế trong khả năng xử lý về những ứng dụng này. Quay ngược lại thời kỳ sử dụng silicon, ở trong nhà máy, bạn làm nóng một miếng silic, sau đó bạn cắt nó thành những lớp mỏng, các lớp silic này được chạy qua quy trình etsing để tạo ra mạch điện, và tùy thuộc vào số tiền bạn đã chi trả cho máy chụp ánh sáng, sẽ quyết định việc mạch được etsing mức độ tinh tế như thế nào. Dựa vào máy chụp ánh sáng và quá trình etsing, xác định số lượng mạch có thể được tạo ra và được nén lên một viên chip. Viên bắt đầu (starts) sau đó được cắt thành các viên chip độc lập. Các viên chip sau khi được tạo ra sẽ được đóng gói để sử dụng trong các sản phẩm và thiết bị điện tử.

Không đủ những nhà máy chế tạo thực hiện quá trình etsing ở mức tinh tế cho những vi mạch tiên tiến này, điều này có nghĩa là Nvidia, người cung cấp chính hiện nay hoặc bất kỳ nhà sản xuất chip mới nào khác, thực tế không tự sản xuất các chip. Các nhà sản xuất chip chỉ thiết kế và sau đó gửi chúng đến một nhà máy chế tạo như Tổng công ty Sản xuất Vi mạch Đài Loan để cắt và etsing silic, và đơn giản là không có đủ những nhà máy chế tạo để xử lý tất cả các đơn đặt hàng từ những đơn vị như NVIDIA.

Do đó, nguồn cung cấp chip của NVIDIA có hạn, và mọi người đều muốn có chúng. Vì vậy, họ phải chia chúng ra và tùy theo mối quan hệ của họ với những khách hàng khác nhau. Điều này đối với một tổ chức như OpenAI, vận hành GPT-4, họ bị ràng buộc bởi số lượng GPU mà họ có.

Vì vậy, khi bạn có một truy vấn, khi bạn nhập một câu hỏi, có một số lượng nhất định của những gì được gọi là “tokens”, nhưng bạn có thể nghĩ về đó như là số từ, được gửi đến GPT-4.

Tuy nhiên, GPT-4 có rất nhiều GPU, nhưng không đủ để xử lý tất cả các truy vấn. Vậy nên, nó bị giới hạn, Điều này được gọi là một giới hạn tốc độ. Nó giới hạn số lượng “tokens” mà bạn có thể xử lý mỗi phút và giới hạn số lượng truy vấn bạn có thể gửi đến nó trong một phút.

Vì vậy, những ứng dụng doanh nghiệp lớn này, rất nhiều công ty đang thử nghiệm chúng trong các hệ thống thí điểm nhỏ. Nhưng khi họ cố gắng mở rộng chúng để sử dụng ở quy mô doanh nghiệp, mọi thứ lại quá chậm. Có nút thắt này mà bạn không thể vượt qua được. Điều này cũng giới hạn cửa sổ ngữ cảnh mà người dùng cộng đồng có thể sử dụng.

Vì cửa sổ ngữ cảnh đó, một lần nữa, những “tokens” phải đi qua đường ống này để đến với mô hình ngôn ngữ lớn. Ý tôi là, chuyện đó sẽ được giải quyết. Và có nhiều công việc được thực hiện, nhiều nghiên cứu, không phải tất cả. Mỗi từ bạn gõ không cần phải được gửi đến LLM, hoặc có các cách khác nhau để làm tăng tốc.

Quá trình suy luận phía LLM, có rất nhiều công việc được thực hiện để cố gắng giảm thiểu điểm hạn chế đó. Nhưng cuối cùng, nó sẽ đòi hỏi nhiều khối silicon hơn và nhiều nhà máy nhiều hơn. Và mất nhiều năm để xây dựng một nhà máy. Có nghĩa là, hiện nay có các nhà máy mới được xây dựng, nhưng sẽ mất 5, 10 năm trước khi có đủ nhà máy sản xuất chip để giảm thiểu điểm hạn chế này.

Đó là một hạn chế sẽ tồn tại trong một khoảng thời gian dài.

Richie Cotton: Thật thú vị khi anh cho rằng chi phí tính toán là một điểm hạn chế. Điểm hạn chế đó đến ngay cả việc thiếu chip GPU.

Craig Smith: Đúng vậy. Điện và năng lượng cần thiết. Nó rất đắt đỏ. Vâng.

Richie Cotton: Okay, vậy nếu điều đó có nghĩa là có động lực kinh tế lớn, để có các mô hình ít tốn công suất tính toán hơn. Và điều đó có thể dẫn đến một sự giảm giá không? Phải chăng chúng ta sắp chứng kiến một cuộc đua xuống đáy về giá cả của các mô hình ngôn ngữ lớn này?

Craig Smith: Tôi không nghĩ vậy vì những hạn chế này, và đó là một điểm rất hay. Bởi vì sự thay thế khi tôi đang nói về đường ống này, tôi đang nói đến cái gì mà giao diện ứng dụng API-

Richie Cotton: Giao diện lập trình. Vâng.

Craig Smith: Tôi sẽ nói là giao thức, nhưng vâng. Anh có cái tên riêng của mình.
LLM. Và sau đó bạn chỉ bị hạn chế bởi số lượng GPU bạn có thể mua, nhưng điều đó rất tốn kém. Vì vậy, tôi nghĩ chắc chắn trong thời gian tới sẽ có sự cạnh tranh về chi phí khiến sản phẩm này rẻ hơn. Tôi không nghĩ điều đó sẽ xảy ra nhanh chóng trong vòng một hoặc hai năm tới. Tôi nghĩ những hạn chế này sẽ tồn tại trong một thời gian.

Richie Cotton: Liên quan đến những điều này, ý tưởng này giống như nền kinh tế của AI đang thay đổi. Nó cũng sẽ ảnh hưởng đến rất nhiều công việc, rất nhiều ngành. Anh có dự đoán được những công việc nào sẽ bị ảnh hưởng nhiều nhất trong vòng một hoặc hai năm tới không?

Craig Smith: Trước hết, đã có những dự đoán điên rồ rằng một nửa số công việc cổ trắng sẽ biến mất hoặc bạn không cần CEO, điều đó có thể được thực hiện bởi bất kỳ công nghệ mới nào, tất cả những dự đoán điên rồ đó thường hoàn toàn sai. Tôi nghĩ nó sẽ ảnh hưởng đến việc làm.

Đây là một khái niệm cũ mà mọi người đã sử dụng từ lâu nay. Đó là, công việc của bạn sẽ không bị thay thế bởi trí tuệ nhân tạo. Nó sẽ bị thay thế bởi người biết cách sử dụng trí tuệ nhân tạo. Tôi nghĩ đây mới là điều quan trọng. Tôi cảm nhận rõ ràng trong giáo dục mầm non và giáo dục trung học, đại học, mọi người lo lắng, ồ, học sinh sẽ không làm bài tập về nhà.

Họ sẽ để GPT làm việc đó. Quan điểm này có thể đúng trong tương lai, khi mà có chiến lược để nhận diện. Tôi nghĩ hầu hết các giáo viên hiện tại đều nhận biết được một bài luận được tạo ra, nhưng mọi người cần phải hiểu cách sử dụng những thứ này, giống như con cái tôi, ngay cả hôm nay, tôi nghĩ mình là khá hiểu biết về công nghệ, nhưng, chúng sẽ chỉ cảm thấy thất vọng, và bing, bing, bing, bing, bing, thế là xong.

Các thế hệ sắp tới sẽ phải làm như vậy, chúng thoải mái và thành thạo khi sử dụng tất cả các công cụ AI này, và những người hoặc các công ty không sử dụng sẽ bị tụt lại và cuối cùng bị lạc lõng, giống như đã xảy ra với Internet.

Những người sớm áp dụng, những người hiểu biết và nhìn thấy cơ hội trong cách sử dụng nó, đã tiến xa hơn so với những người khác.

Và đó không phải là thứ mà tôi đã dành nhiều thời gian để nghiên cứu, nhưng về phần tạo hình ảnh, chắc chắn có rất nhiều nghệ sĩ, họa sĩ đồ họa đang sử dụng công cụ tạo hình ảnh.
Nếu bạn truy cập trang Mid Journey, hầu hết những gì bạn nhìn thấy, phát trực tuyến và bất kỳ ai quan tâm nên thử Mid Journey. Thật thú vị vì bạn có thể thấy những gì mà mọi người đang tạo ra. Hầu hết đều được thực hiện bởi các chuyên gia đang làm rõ hình ảnh cho công việc của họ. Nhưng như tôi nói, có nhiều nền tảng khác nhau mà tôi viết cho, nơi tôi chịu trách nhiệm cung cấp hình ảnh, đây luôn là một thách thức với các bài viết về AI.

Và một trong những điều khiến tôi phiền lòng là Trí tuệ Nhân tạo (AI) và Robot học (Robotics) là hai lĩnh vực khác nhau. Chúng có thể được kết hợp ở một số hình thức, ở một số nơi, nhưng một robot không phải là Trí tuệ Nhân tạo. Và trong mỗi bài viết tôi đọc, thường có một bức ảnh của một ngón tay hoặc một robot đang làm điều gì đó. Vì vậy, khi tôi nghĩ ra hình ảnh cho các bài viết thay vì đi vào cơ sở dữ liệu, tôi nhận được hình ảnh của một con robot hoặc một màn hình giống như ma trận của số hóa.

Mã hoặc thứ gì đó. Tôi tạo ra một hình ảnh và bạn có thể tạo ra những hình ảnh tuyệt vời mà không cần sự trợ giúp từ nghệ sĩ đồ họa. Nếu tôi là một nghệ sĩ đồ họa, tôi không nói với bất kỳ ai về cách nó đang ảnh hưởng đến công việc của mình, nhưng tôi đoán rằng nó đang có ảnh hưởng lớn vì đột ngột bạn không cần một nghệ sĩ để tạo ra hình ảnh cho bạn.

Richie Cotton: Tôi có nhiều câu hỏi dành cho anh về kiến thức về AI, nhưng vì anh đã đề cập rằng không thích việc sử dụng robot làm biểu tượng của AI trong hình ảnh, anh có lựa chọn thay thế không? Giống như, anh thể hiện AI trong hình ảnh như thế nào?

Craig Smith: Đó là lý do tại sao tôi thích khái niệm tổng quát, vì chúng không đại diện cho AI. Chúng tạo ra một số hình ảnh siêu thực hoặc hình ảnh Dada, gợi nhiều liên tưởng, nhưng thực sự làm thế nào anh có thể đại diện cho AI? Anh không thể chụp được hình của một mô hình ngôn ngữ lớn.

Bạn có thể chụp ảnh logo. Bạn có thể chụp hình của giao diện web. Nhưng, Robot học cũng là một lĩnh vực thú vị liên quan đến Trí tuệ Nhân tạo vì đặc biệt là các đại lý Trí tuệ Nhân tạo và các mô hình thế giới bây giờ đang được tích hợp vào bộ não của robot, các bộ điều khiển của robot.
Và một trong những điều đã hạn chế ứng dụng của robot là khả năng không xử lý được môi trường không có cấu trúc. Do đó, hầu hết các robot, đó là một cánh tay cố định trên một nền tảng và đang thực hiện các công việc. Và những robot bạn thấy trong một nhà máy ô tô, ví dụ như robot hàn, chúng được kiểm soát bằng các mô hình toán học rất chính xác, vì vậy nếu đường hàn được đặt ở đúng vị trí, robot sẽ hàn chính xác vào điểm đó, nhưng nếu đường hàn được đặt sai, robot cũng hàn đúng ngay chỗ đó.

Vì vậy, AI hiện nay, với thị giác máy tính, nó có thể nhận ra vị trí của khớp và chiếm quyền kiểm soát từ mô hình toán học để đặt mối hàn ở nơi cần thiết. Và, cuối cùng sẽ dẫn đến việc tạo ra những robot có khả năng hoạt động tự nhiên, có thể nói là một điều chưa từng thấy.

Và một mặt khác của việc Robot học là vấn đề về phần cứng. Chúng ta đã thấy rằng Atlas tại Boston Dynamics có khả năng thực hiện các cử động quay và các hành động khác, với một người sử dụng joystick ẩn nằm ngoài tầm nhìn của máy quay. Bạn không thấy người điều khiển, và bạn cũng không biết được số lần Atlas gặp sự cố hay trượt chân, nhưng các World models và AI agents sẽ giải quyết vấn đề đó.

Tuy nhiên, các hệ thống truyền động, khớp nối và tất cả các cảm biến chuyển động vẫn chưa đạt được sự hoàn hảo. Do đó, robot vẫn đang đối mặt với những trở ngại kỹ thuật phần cứng.

Richie Cotton: Chắc chắn rồi. Đó là một ví dụ hấp dẫn về việc sử dụng cánh tay robot để tận dụng thị giác máy tính và cải thiện chất lượng sản xuất. Tôi muốn quay lại những gì chúng ta đã thảo luận trước đây về hiểu biết về trí tuệ nhân tạo và tác động của nó đối với công việc của bạn. Nếu bạn có kỹ năng về trí tuệ nhân tạo, nó sẽ rất hữu ích cho bạn.

Theo bạn, AI cần những kỹ năng nào để duy trì sự cạnh tranh trong môi trường công việc?

Craig Smith: Đúng vậy. Và, như bạn biết, tôi có con. Những đứa trẻ sớm tham gia vào thị trường lao động. Không cần phải viết code, không cần phải hiểu về các thuật toán hoặc các ưu điểm của mô hình đào tạo, chúng chỉ cần biết cách sử dụng các công cụ. Và hiện nay, chúng ta đang ở giữa sự bùng nổ của việc kết hợp các công cụ này.

Vậy nên, khó mà biết được bạn nên học cách sử dụng công cụ nào. Tuy nhiên, tôi nghĩ rằng điều quan trọng là mọi người, giống như thời kỳ đầu của các trang web, có đủ loại định dạng khác nhau, nhưng chúng đã hội tụ quanh các menu thả xuống thông thường. Khi mọi người nhìn vào giao diện web mới, họ có thể không hiểu nó làm gì, nhưng họ hiểu cách các nút hoạt động hoặc nói chung, cách mà luồng của một trang web hoạt động.

Và tôi nghĩ những mô hình này đã được tiêu chuẩn hóa, thậm chí không phải là mô hình, ý tôi là, các công cụ, mặc dù chúng làm những việc khác nhau, nhưng giao diện đang trở nên quen thuộc với những người đang sử dụng chúng. Và do đó, các mô hình tạo hình ảnh là những công cụ mà mọi người nên hiểu cách sử dụng.

Có rất nhiều loại agent đang xuất hiện và sẽ được sản phẩm hóa, người ta sẽ có thể học cách sử dụng chúng. Và tôi nghĩ rằng điều này quan trọng. Tôi không thể cung cấp cho bạn một danh sách công cụ, nhưng bất kỳ ai quan tâm đến một lĩnh vực cụ thể nào đó nên xem xét những điều mới đang xuất hiện, những gì mọi người đang nói đến và hãy thử chúng.

Richie Cotton: Yeah, tôi nghĩ ở thời điểm này, việc theo kịp với tất cả các công cụ là không thể và tính đến hiện tại chỉ còn hàng nghìn công cụ, nhưng tôi thích ý tưởng chung đó. Vâng, có thể thử nghiệm với một số mô hình tạo hình ảnh này, thử nghiệm một số agent và xem bạn đạt được điều gì. Ngoài các công cụ ra, anh còn có thứ gì nữa không?

Anh cho rằng việc quan trọng là phải có những kỹ năng như vậy, anh có cần hiểu bất cứ điều gì xung quanh như quyền riêng tư hay trường hợp sử dụng hay những thứ tương tự không?

Craig Smith: Đạo đức và quyền riêng tư, đối với tôi, đó thực sự là những vấn đề cần được giải quyết ở cấp độ doanh nghiệp. Tôi chắc chắn rằng những người sử dụng công cụ AI nói chung nên biết dữ liệu của họ đang được sử dụng như thế nào. Nó có thể bị lạm dụng giống như cách mà mọi người trên Internet phải mất một thời gian mới hiểu rằng họ đang cung cấp dữ liệu của mình cho các hệ thống không nhất thiết phải bảo vệ quyền riêng tư của dữ liệu của họ.

Vì vậy, tôi nghĩ nói chung mọi người cần phải nhận thức về điều đó. Mặt đạo đức, mọi người cũng cần nhận thức, nhưng lại là ở mức doanh nghiệp, về cách những hệ thống này có thể bị lạm dụng hoặc chênh lệch và không công bằng. Ví dụ rõ ràng là những hệ thống mà các ngân hàng và công ty tín dụng sử dụng để quyết định ai sẽ được cấp khoản vay và những hệ thống đó nổi tiếng là thiên vị theo những cách không rõ ràng.

Nhưng đó hơn hết là về chính sách doanh nghiệp, một công ty triển khai những mô hình này cần thực sự hiểu về những chênh lệch và hãy cẩn trọng với các công ty nhỏ đã hợp tác với nhau, một công cụ có thể rẻ hơn so với một công ty lớn có tài nguyên để đối phó với những vấn đề này.

Và nếu bạn đang sử dụng các mô hình ngôn ngữ AI tạo văn bản, thì việc hiểu về vấn đề mô phỏng và cẩn thận thực sự là quan trọng. Bạn thực sự phải cẩn thận. Tôi, tôi đã bị sự cố vài lần và may mắn thay, không có gì được công khai với tên tôi, nhưng tôi nhận ra rằng, tôi cần phải cẩn thận.

Richie Cotton: Hoàn toàn đúng. tôi nghĩ những ý kiến như việc hiểu về độ chệch, hiểu về hiện tượng mô phỏng, đảm bảo bạn có sự hoài nghi lành mạnh, chỉ vì AI nói vậy không có nghĩa là đó là sự thật. Điều này rất quan trọng. Okay, vậy nên, chúng ta đã nói rất nhiều về những dự đoán mà anh nghĩ sẽ xảy ra.

Anh đã từng nghe bất kỳ dự đoán nào mà anh nghĩ, không, điều này thật vô nghĩa, tôi không nghĩ điều này sẽ xảy ra trong năm tới?

Craig Smith: Như tôi đã nói với các mô hình ngôn ngữ lớn, đã có rất nhiều cuộc nói chuyện về trí thông minh, và sau đó cũng có rất nhiều cuộc nói chuyện về siêu trí tuệ. Ý tôi là, Sam Altman đã đưa ra một số ý kiến ​​trong FT về việc lập kế hoạch cho GPT 5. Đây là trước khi ông bị sa thải khỏi OpenAI, và điều đó đã tạo ra rất nhiều cuộc thảo luận về siêu trí tuệ sẽ ra mắt vào năm tới hay gì đó. Sự tiến bộ này hướng đến siêu trí tuệ và AGI, tôi nghĩ sẽ xảy ra, nhưng tôi không nghĩ chúng ta đang đi đúng hướng để đạt được điều đó. Và tôi nghĩ điều đó còn rất xa vời, và mọi người không nên mong đợi hay lo lắng vào lúc này.

Những đe dọa hiện tại là các hệ thống có thể truyền bá thông tin sai lệch rẻ tiền. Nhưng với tôi, siêu trí tuệ và AGI, nó vẫn còn cách xa, có thể là vài thập kỷ.
Richie Cotton: Được rồi, Thú vị đấy. AGI không phải là điều chúng ta cần lo lắng trong tương lai gần, nhưng có lẽ để kết thúc, điều gì làm anh hứng thú nhất hiện tại? Đâu là ưu tiên số một của anh?

Craig Smith: World models, nó thực sự làm tôi say mê, bởi vì và tôi nghĩ chúng ta sẽ thấy nhiều kết quả hơn nữa từ nghiên cứu đó trong một hoặc hai năm tới. Vì một lần nữa, khi bạn nghĩ về nó, hãy nghĩ về những gì một mô hình ngôn ngữ lớn đang làm. Nó có một chuỗi văn bản. Và nó dự đoán phần tiếp theo trong chuỗi đó.

Và nó tuyệt vời, nó thực sự tuyệt vời khi có thể làm được điều đó. Nhưng nó không hiểu thực tế cơ bản mà văn bản đó mô tả. Sẽ có rất nhiều công việc cần phải được thực hiện với World models. cũng như một lượng lớn tiền đầu tư cần được bỏ vào để mở rộng chúng. Nhưng đối với tôi, đó là hướng đi mà cá nhân tôi nghĩ là cơ bản hơn và thú vị hơn nhiều trong việc xây dựng trí thông minh thực sự.

Và sau đó, đặt một mô hình ngôn ngữ lên trên đó.

Richie Cotton: Được rồi. Mô hình giọng nói, chắc chắn là điều đáng chờ đợi. Cảm ơn anh rất nhiều vì đã dành thời gian, Greg. Thật tuyệt khi có anh trong chương trình.

Tổng kết

Podcast với sự tham gia của Richie và Craig cho chúng ta biết về những tiến bộ đáng chú ý trong lĩnh vực AI trí tuệ nhân tạo trong năm 2023. Những nhận định về thay đổi của AI trong năm 2024 cũng góp phần thay đổi nền công nghiệp của thế giới. Để không bị tụt lại trong thời hiện đại, mọi người cần đẩy mạnh nỗ lực tìm hiểu sâu rộng về lĩnh vực này, từ đó khai phá toàn bộ tiềm năng và lợi ích mà trí tuệ nhân tạo mang lại.

 

NativeX – Học tiếng Anh online toàn diện “4 kỹ năng ngôn ngữ” cho người đi làm.

Với mô hình “Lớp Học Nén” độc quyền:

  • Tăng hơn 20 lần chạm “điểm kiến thức”, giúp hiểu sâu và nhớ lâu hơn gấp 5 lần.
  • Tăng khả năng tiếp thu và tập trung qua các bài học cô đọng 3 – 5 phút.
  • Rút ngắn gần 400 giờ học lý thuyết, tăng hơn 200 giờ thực hành.
  • Hơn 10.000 hoạt động cải thiện 4 kỹ năng ngoại ngữ theo giáo trình chuẩn Quốc tế từ National Geographic Learning và Macmillan Education.

ĐĂNG KÝ NATIVEX

Tác giả: NativeX

Blog học tiếng anh