JAMSTACK TALK

Đừng thần thánh hóa khả năng lập trình của ChatGPT

4 min read

Một nghiên cứu vừa cho thấy chatbot AI này cũng không quá "cao cường"

Trước khi ChatGPT ra đời và trở nên nổi tiếng, Stack Overflow đã là một nguồn tài liệu quan trọng không thể thiếu đối với các lập trình viên mỗi khi họ cần lời khuyên cho dự án của mình. Tuy nhiên, giống như các diễn đàn thông thường khác, người dùng cần đợi để nhận được câu trả lời từ những người biết về vấn đề mà họ đang đối diện.

Sự khác biệt đến từ ChatGPT. Khả năng cung cấp câu trả lời cho bất kỳ câu hỏi nào, bất kể thời điểm nào, đã làm cho nhiều người tìm đến trí tuệ nhân tạo này hơn là Stack Overflow. Tuy vậy, ngoại trừ một số bài kiểm tra đơn lẻ, chưa có nhiều dữ liệu để đánh giá hiệu quả của ChatGPT trong việc giải đáp các câu hỏi của các lập trình viên. Chính vì vậy, một nghiên cứu mới từ Đại học Purdue đã quyết định thực hiện một nghiên cứu để khám phá vấn đề này.

ChatGPT - Một công cụ rất phổ biến cả trong lĩnh vực lập trình

Để đánh giá hiệu suất của ChatGPT trong việc trả lời các câu hỏi liên quan đến kỹ năng lập trình, các nhà nghiên cứu đã cung cấp cho trí tuệ nhân tạo này 517 câu hỏi trích từ Stack Overflow và tiến hành kiểm tra tính chính xác và chất lượng của những câu trả lời.

Kết quả có thể gây ngạc nhiên về khả năng lập trình của ChatGPT. Trong tổng số 517 câu hỏi, có 259 câu trả lời từ ChatGPT (tương đương khoảng 52%) bị sai sót, trong khi chỉ có 248 câu (48%) được coi là đúng. Hơn nữa, có tới 77% câu trả lời dài và chỉ một phần nhỏ là những câu trả lời tương tự cách mà con người trả lời.

Mặc dù việc trả lời không chính xác cho các câu hỏi là đáng kể, những kết quả cho thấy 65% câu trả lời có tính dễ hiểu và có khả năng giải quyết tất cả các khía cạnh của câu hỏi.

Để xem xét sâu hơn về chất lượng của các phản hồi từ ChatGPT, nhà nghiên cứu đã yêu cầu 12 người có kinh nghiệm lập trình tham gia và đưa ra ý kiến về những vấn đề này.

Mặc dù những người tham gia ưa thích câu trả lời từ Stack Overflow hơn là từ ChatGPT, với chỉ 39,34% người dùng lựa chọn câu trả lời từ ChatGPT. Thế nhưng chính những người tham gia cũng không thể phân biệt được tất các câu trả lời sai được tạo ra bởi ChatGPT.

Dựa trên nghiên cứu này, có thể thấy rằng các câu trả lời từ ChatGPT thường được trình bày một cách rõ ràng, dẫn đến việc người dùng tin tưởng rằng câu trả lời là đúng dễ bỏ qua thông tin không chính xác. "Người dùng có thể bỏ qua thông tin không chính xác trong những câu trả lời của ChatGPT (chiếm 39,34% tổng số câu trả lời) bởi vì những câu trả lời này cung cấp thông tin chi tiết và dễ hiểu, giống như cách mà con người trả lời", như tác giả nghiên cứu đã chia sẻ.

Tuy việc tạo ra những câu trả lời có vẻ hợp lý nhưng không chính xác là một vấn đề nghiêm trọng đối với tất cả các trí tuệ nhân tạo, bởi vì điều này có thể dẫn đến việc lan truyền thông tin sai lệch. Ngoài rủi ro này, mức độ chính xác thấp của các câu trả lời cũng cho thấy rằng mọi người không nên quá ca ngợi khả năng của ChatGPT, đặc biệt là trong lĩnh vực lập trình.

Reference document

GenK - Đừng thần thánh hóa khả năng lập trình của ChatGPT, một nghiên cứu vừa cho thấy chatbot AI này cũng không quá "cao cường" - 21/8/2023

(Truy cập từ: https://genk.vn/dung-than-thanh-hoa-kha-nang-lap-trinh-cua-chatgpt-mot-nghien-cuu-vua-cho-thay-chatbot-ai-nay-cung-khong-qua-cao-cuong-20230819093155918.chn)

Special subject

Google Chrome cập nhật 4 tính năng mới cho tìm kiếm di động nâng cao

Tags: Thiết kế website

BẤM VÀO ĐÂY để nhận tư vấn 1-1 từ đội ngũ chuyên nghiệp của chúng tôi.

BÀI VIẾT LIÊN QUAN

JAMSTACK SEO

Website chuẩn SEO là gì? 11 yếu tố đánh giá một website chuẩn SEO

Vậy làm thế nào để đánh giá mức độ “chuẩn SEO” của website? JAMstack Vietnam sẽ đưa ra 11 yếu tố quan trọng đánh giá một website chuẩn SEO

12 min read

JAMSTACK TALK

Update lớn kỷ niệm 15 năm của Google Chrome có tính năng gì mới

Theo thông tin được chia sẻ trên blog của Google vào ngày thứ Năm (7/9/2023), Chrome sẽ trình làng một thiết kế mới cho phiên bản dành cho máy tính cá nhân, bao gồm nhiều tùy chọn màu sắc và các chủ đề mới để người dùng lựa chọn. Biểu tượng của trình duyệt cũng sẽ được điều chỉnh để tập trung vào khả năng đọc dễ dàng hơn.

5 min read

JAMSTACK TALK

Tìm hiểu tiêu chuẩn an ninh mạng đối với doanh nghiệp

Trong bối cảnh công nghệ phát triển mạnh mẽ, an ninh mạng đã trở thành một trong những yếu tố thiết yếu đối với mọi doanh nghiệp. Tại Việt Nam, theo thống kê của các đơn vị chức năng, tính từ đầu năm 2023 đến nay đã có hơn 13.750 cuộc tấn công mạng vào các hệ thống thông tin, ảnh hưởng nghiêm trọng đến dữ liệu và hoạt động của doanh nghiệp.

8 min read

JAMSTACK TALK

Thanh toán xuyên biên giới phát triển nhanh nhờ công nghệ

Các giải pháp kỹ thuật số như giao dịch tức thì hay ví điện tử khiến dòng tiền xuyên biên giới tại châu Á - Thái Bình Dương tăng trưởng nhanh. Các nhà nghiên cứu dự đoán chỉ trong thị trường B2B, doanh thu thanh toán trong khu vực châu Á - Thái Bình Dương sẽ đạt gần 1.400 tỷ USD vào năm 2025, với mức tăng trưởng kép hàng năm (CAGR) là 10,5%. Một phần quan trọng của sự tăng trưởng này nằm trong phân khúc chuyển tiền xuyên biên giới.

5 min read

Nội dung bài viết

Một nghiên cứu vừa cho thấy chatbot AI này cũng không quá "cao cường"