Computer Vision (Thị giác máy tính) là một lĩnh vực của trí tuệ nhân tạo (AI) giúp máy tính có khả năng “nhìn” và “hiểu” nội dung từ hình ảnh và video, tương tự như cách con người nhìn và hiểu thế giới xung quanh.
Thay vì chỉ xử lý dữ liệu dưới dạng số, thị giác máy tính cho phép máy móc trích xuất thông tin hữu ích từ các dữ liệu trực quan này để thực hiện các nhiệm vụ cụ thể.
Nguyên lý hoạt động
- Thu thập dữ liệu: Hệ thống nhận hình ảnh hoặc video từ camera, cảm biến hoặc các nguồn dữ liệu khác.
- Tiền xử lý: Dữ liệu thô được làm sạch và chuẩn bị để máy tính có thể xử lý, ví dụ như điều chỉnh kích thước, độ sáng, hoặc loại bỏ nhiễu.
- Trích xuất đặc trưng: Đây là bước quan trọng, máy tính sẽ xác định các đặc trưng nổi bật trong ảnh, chẳng hạn như đường viền, góc, hình dạng, màu sắc hoặc họa tiết.
- Phân tích và nhận dạng: Dựa trên các đặc trưng đã trích xuất, thuật toán sẽ phân tích và so sánh chúng với cơ sở dữ liệu đã được huấn luyện để nhận dạng đối tượng, phân loại hình ảnh, hoặc phát hiện chuyển động. Công nghệ này thường sử dụng các mô hình học máy và học sâu, đặc biệt là Mạng nơ-ron tích chập (CNN), để học hỏi từ hàng triệu hình ảnh được gắn nhãn.