Danh mục

Công nghệ ChatGPT đang rất hot, vậy ChatGPT là gì và tại sao nó có thể trả lời câu hỏi như một con người thực sự?

Thứ sáu, 03/02/2023 08:23

Được ra mắt vào tháng 11/2022, hiện có rất ít cải tiến công nghệ thu hút được nhiều sự quan tâm chỉ trong một thời gian ngắn như ChatGPT. ChatGPT hoạt động như thế nào? Nó trả lời câu hỏi bằng cách nào? Đây là tất tần tật những gì bạn nên biết về thứ công nghệ mới ra mắt được quan tâm nhất hiện nay.

ChatGPT là gì?

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

ChatGPT là một chatbot AI đàm thoại được tạo bởi OpenAI. Nó được thiết kế để trả lời các câu hỏi, cung cấp thông tin, giải quyết nhiều vấn đề và truyền đạt phản hồi lại cho bạn theo cách giống như con người.

Bạn có thể nghĩ về ChatGPT như một người đã đọc, tìm hiểu nhiều về các chủ đề khác nhau. Khi bạn hỏi ChatGPT một câu hỏi, nó sẽ tìm kiếm trong bộ nhớ của nó để tìm thông tin liên quan (dựa trên những gì nó đã “đọc” trước đó) và sử dụng nó để tạo phản hồi.

Theo nghĩa này, ChatGPT giống như một con người rất hiểu biết và khả năng đọc tốt, có thể tham gia trò chuyện với bạn mà không bị ràng buộc bởi cơ thể vật lý, cảm xúc hoặc những hạn chế khác của con người.

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

ChatGPT được xây dựng như thế nào?

Để hiểu cách ChatGPT hoạt động, bạn nên xem xét nguồn gốc của nó và "bộ não" đằng sau chatbot AI tiên tiến.

Thứ nhất, ChatGPT được xây dựng bởi con người, giống như mọi công nghệ phần mềm giá trị hiện có. OpenAI đã tạo ra ChatGPT, công ty nghiên cứu và phát triển một “kiểu” AI mang tính cách mạng này, hãng cũng là chủ nhân của các công cụ AI mạnh mẽ khác như DALL-E, InstructGPT và Codex.

Mặc dù ChatGPT đã tạo ra một làn sóng mạnh mẽ vào cuối năm 2022, nhưng hầu hết công nghệ cơ bản hỗ trợ ChatGPT đã tồn tại từ lâu, mặc dù rất ít được công khai.

Thứ hai, mô hình ChatGPT được xây dựng dựa trên GPT-3 (hay cụ thể hơn là GPT-3.5). GPT là viết tắt của “Generative Pre-training Transformer 3”.

GPT-3 là phiên bản thứ ba của dòng mô hình AI GPT và trước GPT-2 và GPT. Các phiên bản trước đó của mô hình GPT đều hữu ích, nhưng GPT-3 và phiên bản GPT-3.5 được tinh chỉnh mạnh mẽ hơn nhiều. Hầu hết những gì ChatGPT có thể làm là nhờ vào công nghệ GPT-3 cơ bản.

GPT là gì?

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

Hãy bắt đầu bằng cách “giải nén” các từ viết tắt theo cách dễ hiểu nhất.

“Generative” trong GPT thể hiện khả năng tạo văn bản ngôn ngữ tự nhiên của con người.

“Pre-training” - (được đào tạo trước) nghĩa là thực tế, mô hình đã được đào tạo dựa trên một số tập dữ liệu nhất định. Giống như bạn đọc một hoặc vài cuốn sách trước khi được yêu cầu trả lời các câu hỏi liên quan.

“Transformer” đại diện cho kiến ​​trúc máy học cơ bản cung cấp năng lượng cho GPT.

Bây giờ, kết hợp tất cả lại với nhau, Generative Pre-training Transformer (GPT) là một mô hình ngôn ngữ đã được đào tạo bằng cách sử dụng dữ liệu từ internet với mục đích tạo văn bản ngôn ngữ của con người khi được đặt câu hỏi. Vì vậy, GPT là AI đã được “traning” (đào tạo), nhưng nó được đào tạo như thế nào?

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

ChatGPT được đào tạo như thế nào?

Bản thân ChatGPT không được đào tạo từ đầu. Thay vào đó, nó là một phiên bản tinh chỉnh của GPT-3.5, bản thân nó là một phiên bản tinh chỉnh của GPT-3. Mô hình GPT-3 đã được đào tạo với một lượng lớn dữ liệu được thu thập từ internet. Giống như Wikipedia, Twitter và Reddit, nó được cung cấp dữ liệu và văn bản của con người được lấy từ mọi “ngóc ngách” của internet.

Nếu bạn đang thắc mắc về cách thức hoạt động của quá trình đào tạo GPT, thì GPT-3 đã được đào tạo bằng cách kết hợp Học có giám sát (Supervised Learning) và Học tăng cường (Reinforcement Learning) thông qua Phản hồi của con người (Human Feedback - RLHF).

Học có giám sát là giai đoạn mà mô hình được đào tạo dựa trên một tập dữ liệu lớn gồm văn bản được lấy từ internet. Giai đoạn Học tăng cường, bản chất của nó là "trial-and-error", nghĩa là thử đi thử lại và rút ra kinh nghiệm sau mỗi lần thử như vậy.

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

Đào tạo với Supervised Learning

Để hiểu rõ hơn về cách thức Học có giám sát và tăng cường áp dụng cho ChatGPT, hãy tưởng tượng một tình huống trong đó một học sinh được giáo viên dạy viết một bài luận. Supervised Learning sẽ tương đương với việc giáo viên cho học sinh đọc hàng trăm bài luận. Mục tiêu ở đây là để học sinh biết cách viết một bài luận bằng cách làm quen với giọng điệu, từ vựng và cấu trúc của hàng trăm bài luận.

Tuy nhiên, sẽ có cái hay và cái dở giữa hàng trăm bài luận đó. Vì học sinh được đọc cả bài hay và bài dở, nên đôi khi, học sinh có thể viết một bài văn dở do chịu ảnh hưởng từ một bài “văn mẫu” dở đã đọc. Điều này có nghĩa là khi được yêu cầu viết một bài luận, học sinh có thể viết một bài luận tốt hoặc chưa đủ tốt. Nếu nó chưa tốt, đây là lúc Reinforcement Learning (Học tăng cường) phát huy tác dụng.

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

Đào tạo với Reinforcement Learning

Sau khi giáo viên xác định rằng học sinh hiểu các quy tắc chung của việc viết luận bằng cách đọc hàng trăm bài luận, thì giáo viên sẽ thường xuyên giao cho học sinh bài tập viết luận. Sau đó, giáo viên sẽ cung cấp các nhận xét về bài tập viết luận, cho học sinh biết những gì họ đã làm tốt và những gì họ có thể cải thiện. Học sinh tiếp thu những nhận xét của giáo viên để về nhà viết các bài luận tiếp theo, giúp học sinh tiến bộ theo thời gian.

Điều này tương tự với giai đoạn Học tăng cường của mô hình đào tạo GPT. Sau khi được cung cấp một lượng lớn văn bản được lấy từ internet, mô hình có thể trả lời các câu hỏi. Tuy nhiên, độ chính xác của nó không phải luôn tuyệt đối.

Mô hình sử dụng thông tin phản hồi để cải thiện khả năng trả lời câu hỏi chính xác hơn và giống với cách con người sẽ trả lời hơn. Đây là cách ChatGPT có thể tạo ra các phản hồi giống như con người, mạch lạc, hấp dẫn và nói chung là chính xác.

ChatGPT có thể trả lời câu hỏi như thế nào?

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

Ví dụ, bạn truy cập trang web ChatGPT và đăng nhập. Bạn nhắc ChatGPT: “hãy viết một bài hát rap theo phong cách của Snoop Dogg”. Nó sẽ phản hồi bằng lời bài hát rap trông rất giống với những gì rapper nổi tiếng Snoop Dogg sẽ viết. Kết quả này có phải thật ảo diệu?

“Phép thuật” đằng sau ChatGPT đều liên quan chặt chẽ đến quá trình “training” của nó.

Sau khi xem hết một cuốn sách giáo khoa chẳng hạn, rất có thể bạn sẽ có thể trả lời bất kỳ câu hỏi nào có nội dung liên quan đến cuốn sách này. Tại sao? Bởi vì bạn đã đọc nó và bạn đã học nó. Điều tương tự xảy ra với ChatGPT, nó cũng biết học hỏi. Và như nền văn minh nhân loại đã chỉ ra, với sự đào tạo và tích lũy đầy đủ, hầu hết mọi vấn đề đều có thể giải quyết được.

ChatGPT hay GPT đã “đọc” một lượng lớn thông tin trên internet. Đó là một kho thông tin khổng lồ. Trong đó, ở đâu đó, có lẽ là lời bài hát của rất nhiều bài hát của Snoop Dogg. Vì vậy, ChatGPT có thể đã sử dụng nó và nhận dạng các mẫu trong lời bài hát của Snoop Dogg. Sau đó, nó sẽ sử dụng “kiến thức” về mẫu này để “dự đoán” lời bài hát giống với những gì Snoop Dogg sẽ viết.

Trọng tâm ở đây là “dự đoán”. ChatGPT không trả lời các câu hỏi giống như cách chúng ta làm. Ví dụ, khi được hỏi với một câu hỏi như “Thủ đô của Bồ Đào Nha là gì?”, bạn có thể nói là Lisbon - trả lời câu hỏi như nói một “sự thật”. Tuy nhiên, ChatGPT không trả lời câu hỏi một cách chắc chắn 100%. Thay vào đó, nó cố gắng dự đoán câu trả lời đúng dựa trên dữ liệu mà nó đã sử dụng trong tập dữ liệu được đào tạo của mình.

Cách tiếp cận của ChatGPT để trả lời câu hỏi

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

Để hiểu rõ hơn về khái niệm dự đoán phản hồi, hãy tưởng tượng ChatGPT là một thám tử được giao nhiệm vụ giải quyết một vụ án truy tìm kẻ trộm. Thám tử được đưa ra bằng chứng, nhưng họ không biết ai đã thực hiện vụ ăn trộm và nó xảy ra như thế nào. Tuy nhiên, với đủ bằng chứng, thám tử có thể “dự đoán” với độ chính xác cao ai là người chịu trách nhiệm cho vụ ăn trộm và quá trình phạm tội được thực hiện như thế nào.

Sau khi sử dụng dữ liệu từ internet, ChatGPT loại bỏ dữ liệu gốc và lưu trữ các kết nối hoặc mẫu mà nó đã học được từ dữ liệu. Các kết nối hoặc mẫu này giống như các bằng chứng mà ChatGPT phân tích khi cố gắng phản hồi bất kỳ câu hỏi nào.

Vì vậy, về lý thuyết, ChatGPT giống như một thám tử giỏi. Nó không biết chắc các dữ kiện của một câu trả lời là gì, nhưng nó cố gắng, với độ chính xác ấn tượng để dự đoán một chuỗi logic của văn bản ngôn ngữ con người sẽ trả lời câu hỏi một cách thích hợp nhất. Đây là cách bạn nhận được câu trả lời cho câu hỏi của bạn.

Và đây cũng là lý do tại sao một số câu trả lời của ChatGPT trông rất thuyết phục nhưng đôi khi lại sai lầm khủng khiếp.

ChatGPT: Trả lời như con người, "suy nghĩ" như cỗ máy!

ChatGPT, công nghệ, chatbot, AI, trí tuệ nhân tạo

Các chi tiết kỹ thuật cơ bản của ChatGPT rất phức tạp. Tuy nhiên, từ quan điểm cơ bản, nó hoạt động bằng cách học và tái tạo những gì nó đã học được khi được hỏi, giống như chúng ta làm với tư cách là con người.

Khi ChatGPT phát triển thông qua nghiên cứu, cách thức hoạt động của nó có thể thay đổi. Tuy nhiên, các nguyên tắc hoạt động cơ bản của nó sẽ vẫn giữ nguyên trong một thời gian, ít nhất là cho đến khi một công nghệ mới đột phá xuất hiện.

Thanh Ngọc (Theo Thương Hiệu và Pháp Luật)

Tin được quan tâm

4 tỉnh ở miền Trung dự kiến không sáp nhập

Bộ Nội vụ vừa có Tờ trình gửi Chính phủ về dự thảo Nghị quyết của Ủy ban Thường vụ Quốc hội về sắp xếp...
Dòng sự kiện 2 ngày, 23 giờ trước

5 con giáp sẽ thấy sự giàu có tăng vọt sau Tết Thanh Minh

Những người sinh năm Tý, Dần, Tỵ, Thân và Dậu sẽ gặp nhiều may mắn sau Tết Thanh minh.
Đời sống số 2 ngày, 23 giờ trước

Ngày mai là Tết Hàn thực mùng 3 tháng 3 âm lịch: Thắp hương khung giờ nào đẹp nhất?

Tết Hàn Thực là dịp để mỗi gia đình Việt bày tỏ lòng thành kính, thực hiện nghi thức cúng lễ, cầu mong sự bình...
Kiến thức 2 ngày, 24 giờ trước

Từ nay tới 31/12/2025: Người dân không đi đổi đăng ký xe bị xử phạt 6 triệu đồng, đúng không?

Theo quy định, những trường hợp này cần đi đổi đăng ký xe trong năm 2025, cố tình giữ lại bị xử phạt nặng.
Kiến thức 2 ngày, 19 giờ trước

Đến 31/12/2025: Mức tăng lương hưu 15% có tiếp tục được áp dụng không?

Mức tăng lương hưu 15% trong năm 2025 sẽ tiếp tục áp dụng cho cán bộ công chức, viên chức đã nghỉ hưu trước và...
Kiến thức 2 ngày, 2 giờ trước

Bắt đầu từ 1/7/2025: Người có BHYT đủ 5 năm liên tục sẽ được hưởng 100% chi phí khám chữa bệnh?

Từ ngày 1/7/2025, Luật BHYT có những sửa đổi bổ sung mang lại nhiều quyền lợi hơn cho người tham gia, người dân nên chú...
Kiến thức 2 ngày, 5 giờ trước

Tin cùng mục

Cách gửi ảnh chất lượng cao HD qua Messenger cho người dùng tại Việt Nam, tha hồ mà 'sống ảo'

Facebook đã cho phép gửi ảnh chất lượng cao HD thông qua ứng dụng Messenger với người dùng tại Việt Nam.
Xài gì 1 ngày, 2 giờ trước

3 màu xe trông đẹp nhưng khó sửa, khó giữ màu, chọn nhầm là tiếc cả quá trình sử dụng

Ngành ô tô phát triển mạnh, thu nhập người dân tăng cùng với nhiều chính sách ưu đãi khiến việc sở hữu xe trở nên...
Đi gì 3 ngày, 2 giờ trước

Nguyên tắc lùi ô tô an toàn, tin rằng cả bạn và tôi đều sẽ được hưởng lợi rất nhiều sau khi đọc

Trên thực tế, việc lái xe ô tô, đặc biệt lúc lùi xe cần phải có nguyên tắc đúng. Hãy cùng đọc những nguyên tắc...
Đi gì 3 ngày, 3 giờ trước

Bật mí lí do khiến Pháo tự tin 'xuyên thẳng' dư luận, không ngại 'chất riêng'

Trong thời đại mới, phụ nữ không chỉ dừng lại ở những khuôn khổ truyền thống mà ngày càng khẳng định bản thân theo nhiều...
Đi gì 5 ngày, 16 giờ trước

Quên mã PIN Messenger: Lấy lại đơn giản và nhanh chóng chỉ với vài thao tác

Để khôi phục mã PIN Messenger sau khi bị mã hóa đầu cuối, bạn chỉ cần thực hiện một vài bước đơn giản.
Xài gì 5 ngày, 18 giờ trước

Viễn thông Đông A chính thức trở thành nhà phân phối hãng khóa điện tử VOC bán chạy nhất hiện nay

Viễn Thông Đông A vừa chính thức trở thành nhà phân phối khóa điện tử thương hiệu VOC, dòng khóa thông minh bán chạy nhất...
Sản phẩm hot 5 ngày, 23 giờ trước

Tin mới cập nhật

Tiêu chí xét thăng quân hàm, nâng lương trước thời hạn đối với sĩ quan cấp tướng, tá, úy trong quân đội từ 22/03/2025

Bộ trưởng Bộ Quốc phòng ban hành Thông tư 18/2025/TT-BQP ngày 22/3/2025 quy định phong quân hàm học viên tốt nghiệp đào tạo sĩ quan...
Tin trong ngày 30 phút trước

Rất giỏi khiêu khích! 3 cung hoàng đạo thích buôn chuyện nhất: Người buôn chuyện số 1: Miệng rộng: 'Nó đáng sợ đến mức khiến người khác rùng mình'

Bạn có tin vào tử vi không? Người ta nói rằng mỗi con giáp đều có tính cách và đặc điểm khác nhau, chẳng hạn...
Đời sống số 30 phút trước

Từ 1/1/2025, công an xã được tuần tra, kiểm soát giao thông trong những trường hợp nào?

Theo luật, công an xã vẫn được tham gia tuần tra, kiểm soát về trật tự, an toàn giao thông đường bộ trong trường hợp...
Kiến thức 31 phút trước

Tuyển sinh năm 2025: ĐH Quốc gia Hà Nội sẽ lấy bao nhiêu chỉ tiêu?

So với năm ngoái, năm nay ĐH Quốc gia Hà Nội tăng chỉ tiêu tuyển sinh, mở rộng cánh cửa cho nhiều sĩ tử bước...
Kiến thức 32 phút trước

4 tình huống trêu chọc con trẻ mà cha mẹ nhất định phải tránh

Trêu chọc trẻ em có thể tạo không khí vui vẻ trong gia đình, nhưng nếu không cẩn thận, nó có thể gây tổn thương...
Kiến thức 32 phút trước

Ngọc Trinh khoe vòng một căng tràn trên phố, 36 tuổi chỉ là con số

Chiếc corset ôm sát làm nổi bật vòng eo con kiến và 'gò bồng đảo' đẫy đà của Ngọc Trinh, đem lại cảm giác vừa...
VIDEO 32 phút trước

Kỳ Duyên lên tiếng sau màn 'dìm' Trấn Thành khiến mạng xã hội dậy sóng

'Tôi tính rủ mọi người chạy bộ để nâng cao sức khoẻ tiện lưu lại vài khoảnh khắc kỷ niệm thế nhưng giờ gặp ai...
VIDEO 33 phút trước

Pin mới sẽ giúp iPhone 17 Air tạo đột phá

Ngay khi có thông tin rò rỉ về việc iPhone 17 Air có thể đạt độ mỏng chỉ 5,44 mm, câu hỏi được đặt ra...
Kiến thức 34 phút trước

Đặt tên đăng nhập tài khoản ngân hàng theo kiểu này, tiền bốc hơi lúc nào không hay

Theo quy định, ngân hàng không được phép tiết lộ số tài khoản, username, số điện thoại, email… cho bất kỳ ai, trừ trường hợp...
Làm sao 1 giờ, 13 phút trước

Ba tỉnh: Ninh Bình, Hà Nam và Nam Định, nơi nào có ít huyện nhất?

Đây là tỉnh có ít đơn vị hành chính cấp huyện nhất cả nước, đó là?
Kiến thức 1 giờ, 13 phút trước