ChatGPT Với Google Bard: So Sánh Sự Khác Biệt Về Kỹ Thuật

chatgpt-voi-google-bard-so-sanh-su-khac-biet-ve-ky-thuat


Sự khác biệt lớn nhất giữa Google Bard và ChatGPT là tại thời điểm viết bài này, Bard biết về ChatGPT nhưng ChatGPT lại không hề hay biết về Bard. Nhưng tôi có thể thử với ChatGPT, trong khi Google Bard vẫn nằm ngoài tầm với của hầu hết chúng ta.

chatgpt-voi-google-bard-so-sanh-su-khac-biet-ve-ky-thuat-1

Bắt đầu trận chiến ChatGPT vs Google Bard

Cả ChatGPT và Google Bard đều là chatbot AI. Phiên bản đơn giản nhất của công nghệ này đã tồn tại trên điện thoại thông minh của bạn - bạn nhập “Tốt” và điện thoại của bạn dự đoán rằng từ tiếp theo bạn có thể muốn sử dụng là “buổi sáng”.

ChatGPT ban đầu được phát triển bởi OpenAI và sau đó được Microsoft đầu tư với số tiền khổng lồ 10 tỷ USD (ngoài khoản đầu tư 1 tỷ USD trước đó). Google, hơi hoảng sợ rằng sự độc quyền tìm kiếm của họ có thể sắp kết thúc, đã phản ứng bằng cách tiết lộ Bard, phiên bản công nghệ của họ với một số sai sót. Trong bản demo trực tiếp đầu tiên, Bard đã mắc một số lỗi thực tế. Xấu hổ cho Google, để nói rằng ít nhất.

ChatGPT và Google Bard phức tạp hơn một chút so với văn bản tiên đoán trên điện thoại thông minh, nhưng để hiểu được sự khác biệt giữa hai chatbot AI, đó là tất cả những gì bạn cần biết để bắt đầu.

Chúng ta hãy xem xét sâu hơn về sự khác biệt kỹ thuật giữa hai công cụ AI này.

ChatGPT vs Bard: Có gì bí ẩn?

Bạn đang ở đây để có một bảng nhanh chóng, dễ dàng để có được sự khác biệt về kỹ thuật giữa hai động cơ. Đây chính xác là điều đó. Nếu bạn muốn có một giao diện sắc thái hơn, vui lòng cuộn thêm.

 

ChatGPT

Bard

Model  

                GPT-3.5

LaMDA , hoặc Mô hình ngôn ngữ cho các ứng dụng đối thoại

Kiến trúc mạng lưới thần kinh

Máy biến áp

Máy biến áp

Dữ liệu đào tạo

Văn bản trên web, chủ yếu là một bộ dữ liệu có tên là “thu thập thông tin chung”, sẽ ngừng hoạt động vào giữa năm 2021

1,56 triệu từ dữ liệu hộp thoại công khai và văn bản web

 

Mục đích

Trở thành một chatbot tạo văn bản đa năng

Cụ thể để giúp hỗ trợ tìm kiếm

Thông số

175 tỷ tham số

137 tỷ thông số

Người sáng tạo

OpenAI

Google

Thuận lợi

-Mở cho tất cả mọi lúc

- Linh hoạt hơn và có khả năng mở rộng văn bản

 

- Cắt dữ liệu đào tạo vào năm 2021

- Dữ liệu đào tạo cho đến ngày nay

- Được đào tạo đặc biệt để đối thoại, vì vậy âm thanh của con người hơn khi bạn sử dụng nó để nói

Khó khăn

- Đối thoại chưa thuyết phục

- Tinh chỉnh chưa kỹ

- Hiện không có sẵn

- Có thể không phù hợp với việc tạo văn bản nói chung

Bây giờ bạn đã có TL; DR, hãy tìm hiểu sâu hơn về tất cả các chỉ số này.

ChatGPT là gì?

ChatGPT bùng nổ vào ngày 30 tháng 11 năm 2022. Đến ngày 4 tháng 12 năm 2022, dịch vụ này đã có hơn một triệu người dùng hàng ngày. Vào tháng 1 năm 2023, con số đó đã tăng vọt lên hơn 100 triệu người dùng.

Nó ngay lập tức trở nên phổ biến vì lý do cơ bản là nó có thể cung cấp cho bạn những câu trả lời chắc chắn về một số chủ đề theo cách nghe gần giống với con người và bất kỳ ai có kết nối internet đều có thể truy cập được.

ChatGPT được tạo bởi OpenAI, một phòng thí nghiệm AI có trụ sở tại San Francisco tập trung vào việc tạo ra một AI thân thiện. Chatbot nằm trên GPT-3.5, đây là một mô hình ngôn ngữ lớn, khi được cung cấp văn bản, có thể tiếp tục lời nhắc.

Ngoài ra, ChatGPT còn được đào tạo thêm một số - người huấn luyện con người đã cải thiện mô hình bằng cách tương tác với mô hình đó và “thưởng” cho mô hình cho các câu trả lời chất lượng cao hơn.

Dữ liệu đào tạo

GPT-3.5 đã được đào tạo dựa trên tập dữ liệu khổng lồ về văn bản web, bao gồm tập dữ liệu phổ biến có tên là Thu thập thông tin chung. Thu thập thông tin chung chứa hàng petabyte dữ liệu web với dữ liệu trang web thô, trích xuất siêu dữ liệu và trích xuất văn bản. Ví dụ: nó bao gồm một bộ sưu tập các URL của riêng chúng tôi từ StrataScratch. Thật hoang đường khi nghĩ rằng ChatGPT đã được đào tạo bằng cách sử dụng các trang web mà chúng ta truy cập hàng ngày phải không?

Thu thập thông tin chung chịu trách nhiệm cho 60% dữ liệu đào tạo, nhưng GPT-3.5 cũng lấy dữ liệu từ các nguồn khác.

chatgpt-voi-google-bard-so-sanh-su-khac-biet-ve-ky-thuat-2

Google Bard là gì?

Bard là câu trả lời của Google cho sự phổ biến của ChatGPT. Không giống như ChatGPT, Bard được cung cấp bởi mô hình LaMDA của riêng Google, viết tắt của Mô hình ngôn ngữ cho các ứng dụng đối thoại. Và không giống như ChatGPT, nó không thú vị bằng một lý do đơn giản là hầu hết mọi người chưa thể truy cập nó. Mặc dù Google đã tổ chức một bản demo đầy lỗi của Bard vào đầu tháng 2, nhưng hiện tại nó chỉ khả dụng cho một số ít người được chọn.

Ưu điểm chính của Google's Bard là nó mở cho internet. Hỏi ChatGPT chủ tịch là ai thì nó cũng không biết. Điều này là do dữ liệu đào tạo đã bị cắt vào khoảng giữa năm 2021. Trong khi đó, Bard dựa trên thông tin trên internet ngày nay. Hãy hỏi Bard, và về lý thuyết, Bard sẽ có thể lấy từ dữ liệu có sẵn trên internet ngày nay để cho bạn biết tổng thống là ai.

Mặc dù bạn chưa thể thử ngay, nhưng thật dễ dàng để thấy Bard nổi bật như thế nào so với ChatGPT ở một số khía cạnh chính.

chatgpt-voi-google-bard-so-sanh-su-khac-biet-ve-ky-thuat-3

Dữ liệu đào tạo

Đầu tiên, LaMDA được đào tạo về đối thoại, đặc biệt là để nói chuyện trong cuộc trò chuyện, không chỉ tạo ra văn bản như các mô hình GPT-n. Mặc dù ChatGPT không giấu giếm dữ liệu đào tạo của mình, nhưng chúng tôi vẫn chưa biết nhiều về dữ liệu mà Bard đã được đào tạo.

Chúng ta có thể ngoại suy một chút bằng cách xem tài liệu nghiên cứu của LaMDA. Các nhà nghiên cứu của Google cho biết 12,5% dữ liệu đào tạo đến từ Common Crawl, giống như các mô hình GPT-n. 12,5% khác đến từ Wikipedia. Và theo tài liệu nghiên cứu, họ đã sử dụng 1,56 nghìn tỷ từ “dữ liệu hộp thoại công khai và văn bản web”.

Đây là sự cố đầy đủ: 

12,5% dữ liệu dựa trên C4 (một dẫn xuất của dữ liệu Thu thập thông tin chung)

12,5% Wikipedia tiếng Anh

12,5% tài liệu mã từ các trang web hỏi đáp lập trình, hướng dẫn và các trang khác

6,25% tài liệu web tiếng Anh

6,25% tài liệu web không phải tiếng Anh

50% dữ liệu hộp thoại từ các diễn đàn cộng cộng

Chúng tôi biết dữ liệu Thu thập thông tin chung và rõ ràng là bạn biết Wikipedia. Phần còn lại? Nó được cố tình ẩn đi, có lẽ là để giữ an toàn cho Bard (và LaMDA) khỏi những kẻ sao chép.

LaMDA được xây dựng bằng cách tinh chỉnh một nhóm các mô hình ngôn ngữ nơ-ron dựa trên Transformer, là một kiến ​​trúc mạng nơ-ron nguồn mở ban đầu được phát triển bởi Google . (Lưu ý thú vị - GPT cũng được xây dựng trên Transformer.)

chatgpt-voi-google-bard-so-sanh-su-khac-biet-ve-ky-thuat-4
ChatGPT có một số biện pháp bảo vệ để giữ cho nó không trở nên quá khó chịu hoặc nói ra những điều hoàn toàn vô nghĩa, nhưng Google đã thực sự nhấn mạnh cách họ đã cẩn thận tạo ra các đảm bảo chất lượng để giúp Bard trở thành một chatbot tốt hơn, an toàn hơn để sử dụng. Bard được tinh chỉnh để thúc đẩy “chất lượng, tính ổn định và an toàn”.

Google có rất nhiều điều để nói về vấn đề này và tôi khuyên bạn nên đọc bài đăng trên blog của họ về vấn đề này, nhưng nếu bạn không có nhiều thời gian, về cơ bản, nó sẽ được chia thành:

  • Bard nên đưa ra những câu trả lời hợp lý – không vô lý, không mâu thuẫn
  • Bard nên đưa ra những câu trả lời sâu sắc, dí dỏm hoặc bất ngờ theo cách tốt
  • Bard nên tránh mọi thứ có nguy cơ gây hại cho người dùng - máu me, thiên vị, khuôn mẫu đáng ghét, đó là một vài điều
  • Bard không nên bịa chuyện

Nhờ một lần khởi chạy bị lỗi, chúng tôi đã biết rằng Google vẫn chưa tìm ra yêu cầu cơ bản đó. Nhưng điều đáng chú ý là Google đang nói rất rõ ràng về các yêu cầu thiết kế này theo cách mà ChatGPT chưa làm được – ít nhất là chưa.

ChatGPT vs Google Bard: Tham số mô hình và tại sao nó lại quan trọng?

ChatGPT có nhiều tham số mô hình hơn Bard - 175 tỷ so với 137 tỷ. Bạn có thể coi các tham số là các núm hoặc đòn bẩy mà mô hình điều chỉnh để phù hợp với dữ liệu mà mô hình đang được huấn luyện. Nhiều tham số hơn thường có nghĩa là mô hình có nhiều khả năng hơn để nắm bắt các mối quan hệ phức tạp trong ngôn ngữ, nhưng nó cũng có nguy cơ bị quá khớp.

Google Bard có thể kém linh hoạt hơn nhưng cũng có thể mạnh mẽ hơn đối với các trường hợp sử dụng ngôn ngữ mới so với ChatGPT.

ChatGPT vs Google Bard: Họ có điểm chung gì?

Điều đáng chú ý là cả Bard và ChatGPT đều sử dụng các mô hình (lần lượt là LaMDA và GPT-3.5) sử dụng các mạng thần kinh học sâu dựa trên Transformer.

Ví dụ, Transformer có thể tạo một mô hình được đào tạo để đọc một câu hoặc đoạn văn, chú ý đến cách các từ đó liên quan với nhau và sau đó dự đoán những từ mà nó nghĩ sẽ xuất hiện tiếp theo – tương tự như văn bản tiên đoán trên điện thoại thông minh của bạn, như tôi đã đề cập trước đó.

Tôi sẽ không đi sâu vào vấn đề ở đây, nhưng tất cả những gì bạn cần biết là điều này có nghĩa là về cốt lõi, Bard và ChatGPT không quá khác biệt với nhau.

ChatGPT so với Google Bard: Quyền sở hữu

Mặc dù quyền sở hữu không hẳn là một sự khác biệt về mặt kỹ thuật, nhưng nó đáng để ghi nhớ.

Google Bard do Google sản xuất và sở hữu hoàn toàn, ngoài LaMDA, cũng do Google tạo ra.

ChatGPT được phát triển bởi OpenAI, một phòng thí nghiệm nghiên cứu AI có trụ sở tại San Francisco. OpenAI ban đầu là tổ chức phi lợi nhuận nhưng nó đã tạo ra một công ty con vì lợi nhuận vào năm 2019. OpenAI cũng đứng sau Dall-E, thế hệ AI chuyển văn bản thành hình ảnh mà bạn có thể đã từng sử dụng.

Mặc dù Microsoft đã đầu tư rất nhiều tiền vào OpenAI, nhưng hiện tại, đây là một tổ chức nghiên cứu độc lập.

Cái nào là tốt nhất, ChatGPT hay Google Bard?

Thật khó để đưa ra một câu trả lời công bằng cho câu hỏi này bởi vì cả hai đều rất giống nhau, nhưng lại rất khác nhau. Đầu tiên, hầu như không ai có thể truy cập Google Bard ngay bây giờ. Mặt khác, dữ liệu đào tạo của ChatGPT đã bị cắt gần hai năm trước.

Cả hai đều là trình tạo văn bản - bạn đưa ra lời nhắc và cả Google Bard cũng như ChatGPT đều có thể trả lời lời nhắc đó. Cả hai đều có hàng tỷ tham số để tinh chỉnh mô hình. Cả hai đều có các nguồn dữ liệu đào tạo chồng chéo và cả hai đều được xây dựng trên Transformer, cùng một mô hình mạng thần kinh.

Chúng cũng được thiết kế cho các mục đích khác nhau. Bard sẽ giúp bạn điều hướng tìm kiếm Google. Nó được thiết kế để đàm thoại. ChatGPT có thể tạo toàn bộ bài đăng trên blog. Nó được thiết kế để tạo ra các đoạn văn bản có ý nghĩa.

Cuối cùng, sự khác biệt về kỹ thuật giữa ChatGPT và Google Bard chỉ nhấn mạnh mức độ phát triển của công nghệ tạo văn bản do AI cung cấp. Mặc dù cả hai đều có con đường để đi và cả hai đều phải đối mặt với tranh cãi về khía cạnh bản quyền và đạo đức, nhưng cả hai máy phát điện đều là những minh chứng mạnh mẽ cho các mô hình AI hiện đại.

Copyright Disclaimer:

This site does not store any files on its server. We only index and link to content provided by other sites. Please contact the content providers to delete copyright contents if any and email us, we'll remove relevant links or contents immediately.

Tuyên bố miễn trừ bản quyền:

Trang web này không lưu trữ bất kỳ tệp nào trên máy chủ của nó. Chúng tôi chỉ lập chỉ mục và liên kết đến nội dung được cung cấp bởi các trang web khác. Vui lòng liên hệ với các nhà cung cấp nội dung để xóa nội dung bản quyền nếu có và gửi email cho chúng tôi, chúng tôi sẽ xóa các liên kết hoặc nội dung có liên quan ngay lập tức.

Tham khảo các bài viết cùng chủ đề:

Read Also
Đăng nhận xét