Để cung cấp một cái nhìn tổng quan và dễ so sánh về các cách tiếp cận phân loại LLM đã được thảo luận, bảng dưới đây hệ thống hóa các tiêu chí chính, các loại con và đặc điểm nổi bật của từng phương pháp
Phương pháp phân loại | Tiêu chí chính | Các loại con | Đặc điểm nổi bật của từng loại con | Ví dụ minh họa |
Dựa trên Kiến trúc | Cấu trúc mạng nơ-ron, cách xử lý/tạo văn bản | 1. Tự hồi quy (Autoregressive) | Dự đoán token tiếp theo dựa trên các token trước; mạnh về tạo văn bản trôi chảy. | GPT series (OpenAI) |
2. Tự mã hóa (Autoencoding) | Hiểu ngữ cảnh bằng cách dự đoán token bị che; mạnh về hiểu sâu ngữ cảnh, ngữ nghĩa. | BERT (Google) | ||
3. Chuỗi sang Chuỗi (Seq2Seq) | Encoder xử lý đầu vào, Decoder tạo đầu ra; hiệu quả cho dịch thuật, tóm tắt. | T5 (Google) | ||
4. Hỗn hợp Chuyên gia (MoE) | Nhiều “chuyên gia” nhỏ, chỉ một phần được kích hoạt; cân bằng hiệu năng và chi phí. | DBRX (Databricks), Snowflake Arctic | ||
Dựa trên Tính sẵn có | Khả năng truy cập mã nguồn, trọng số | 1. Mã nguồn mở (Open-Source) | Công khai mã nguồn, trọng số; minh bạch, linh hoạt, tùy biến cao. | Llama (Meta), BLOOM, Falcon, Pythia |
2. Độc quyền/Thương mại (Proprietary) | Phát triển bởi công ty tư nhân, truy cập qua API/giấy phép; thường hiệu năng cao, hỗ trợ chuyên nghiệp. | GPT-4 (OpenAI), Gemini (Google), Claude (Anthropic) | ||
Dựa trên Tính chuyên biệt theo Miền | Phạm vi kiến thức, lĩnh vực ứng dụng | 1. Đa năng (General-Purpose) | Xử lý nhiều tác vụ trên nhiều lĩnh vực; huấn luyện trên dữ liệu đa dạng. | GPT-3, Llama 2 (ban đầu) |
2. Chuyên biệt theo Miền (Domain-Specific) | Tối ưu cho ngành cụ thể (y tế, tài chính, pháp lý); huấn luyện bổ sung dữ liệu chuyên ngành, kết quả chính xác hơn trong miền đó. | Med-PaLM, BloombergGPT | ||
Dựa trên Phương pháp Huấn luyện/Tinh chỉnh | Cách mô hình được huấn luyện/điều chỉnh | 1. Ngôn ngữ Thô/Chung (Generic/Raw) | Dự đoán từ tiếp theo dựa trên dữ liệu huấn luyện; chủ yếu cho truy xuất thông tin. | Các mô hình nền tảng sau pre-training |
2. Tinh chỉnh theo Hướng dẫn (Instruction-tuned) | Huấn luyện để phản hồi theo hướng dẫn cụ thể; linh hoạt cho nhiều tác vụ (phân tích tình cảm, tạo văn bản/mã). | InstructGPT, Llama-Instruct | ||
3. Tinh chỉnh cho Hội thoại (Dialog-tuned) | Huấn luyện để đối thoại tự nhiên, duy trì ngữ cảnh; dùng cho chatbots, AI hội thoại. | ChatGPT, Claude, Gemini (chatbot) |
Bảng tóm tắt này giúp hệ thống hóa kiến thức đã trình bày, cho phép người đọc nhanh chóng nắm bắt các điểm khác biệt cốt lõi giữa các cách phân loại và các loại LLM. Nó phục vụ như một tài liệu tham khảo nhanh và củng cố sự hiểu biết về sự đa dạng của thế giới LLM, đồng thời làm nổi bật các ví dụ cụ thể để minh họa cho từng loại.
Về thông tin mô tả chi tiết của các phương pháp phân loại các mô hình Ngôn ngữ lớn, xin vui lòng tham khảo bài viết bên dưới.
1 thought on “Bảng tóm tắt các phương pháp phân loại LLM”
Bài viết rất hay.
Đúng cái mình cần