Загрузка...

🧐👉 GLM-OCR: Model OCR 0.9B nhỏ gọn, tốc độ cao, đánh bại nhiều đối thủ lớn #QixNewsAI

🔥 Zhipu AI vừa ra mắt GLM-OCR – model OCR đa phương thức 0.9 tỷ tham số, kết hợp encoder CogViT 0.4B và decoder GLM 0.5B, tối ưu cho nhận dạng tài liệu phức tạp và trích xuất thông tin quan trọng.

⚡️ GLM-OCR sử dụng Multi-Token Prediction, tăng tốc độ giải mã lên 50%, pipeline hai giai đoạn: phân tích bố cục bằng PP-DocLayout-V3 rồi nhận diện song song từng vùng. Model hỗ trợ cả phân tích tài liệu xuất ra Markdown/JSON và trích xuất thông tin quan trọng (KIE) trực tiếp ra JSON.

📊 Kết quả benchmark cực mạnh: 94.6 điểm OmniDocBench v1.5, 94.0 OCRBench, 96.5 UniMERNet, nhưng vẫn bị MinerU 2.5 vượt ở PubTabNet và Gemini-3-Pro nhỉnh hơn ở KIE.

💡 GLM-OCR hỗ trợ vLLM, SGLang, Ollama, có thể fine-tune qua LLaMA-Factory và cung cấp API giá rẻ.

👉 Đây là lựa chọn đáng chú ý cho ai cần OCR mạnh, gọn, triển khai thực tế, dù chưa phải "vô đối" trên mọi mặt trận!

#GLM_OCR #Zhipu_AI #nhận_dạng_tài_liệu #Multi_Token_Prediction #benchmark_OCR #QixNewsAI #Shorts

Видео 🧐👉 GLM-OCR: Model OCR 0.9B nhỏ gọn, tốc độ cao, đánh bại nhiều đối thủ lớn #QixNewsAI канала QixNews Tin Nhanh
Яндекс.Метрика
Все заметки Новая заметка Страницу в заметки
Страницу в закладки Мои закладки
На информационно-развлекательном портале SALDA.WS применяются cookie-файлы. Нажимая кнопку Принять, вы подтверждаете свое согласие на их использование.
О CookiesНапомнить позжеПринять