Large Language Model (LLM)

« Back to Glossary Index

Large Language Model (LLM) là một loại mô hình Trí tuệ Nhân tạo (AI) được huấn luyện trên một lượng dữ liệu văn bản khổng lồ. Mục tiêu chính của chúng là hiểu và tạo ra ngôn ngữ tự nhiên giống như con người.

Bạn có thể hình dung LLM như một “bộ não” kỹ thuật số siêu lớn, được đào tạo chuyên sâu về ngôn ngữ. Về cơ bản, chúng hoạt động bằng cách dự đoán từ tiếp theo trong một chuỗi văn bản, dựa trên những kiến thức đã học được từ kho dữ liệu khổng lồ trong quá trình huấn luyện.

Yếu tố “lớn” ở đây đề cập đến quy mô khổng lồ của hai thành phần chính:

Dữ liệu huấn luyện: LLM được “học” từ hàng tỷ, thậm chí hàng nghìn tỷ từ, câu, đoạn văn bản lấy từ sách, báo, website và nhiều nguồn khác.
Số lượng tham số (parameters): Đây là các biến số mà mô hình tự điều chỉnh trong quá trình học để cải thiện khả năng dự đoán. LLM có thể có từ hàng tỷ đến hàng nghìn tỷ tham số.

Chính quy mô khổng lồ này đã mang lại cho LLM khả năng hiểu và tạo ra ngôn ngữ với độ phức tạp đáng kinh ngạc.

« Back to Glossary Index