🧐👉 Твой ChatGPT врёт, а ты не видишь: инструменты Technion ловят галлюцинации изнутри #QixNewsAI

🛠️ Как быстро попробовать LOS-Net (инструкция для инженеров)

LOS-Net — самый доступный инструмент из трёх, потому что ему нужны только выходные вероятности (logprobs), а не внутренности модели. Идеально для тех, кто сам хостит Llama, Qwen или Mistral.

Шаги:
1. Клонируй репозиторий: `git clone https://github.com/BarSGuy/LLM-Output-Signatures-Network`
2. Создай conda-окружение: `conda env create -f los_net_env.yml && conda activate los_net_env`
3. Запусти эксперимент через wandb: `wandb sweep ./sweeps/LOS/DC/llama_13b_BookMIA.yaml`

⚠️ Потребуется одна NVIDIA L-40 GPU, обучение займёт меньше часа.

📰 Что произошло

Исследователи из Technion под руководством доктора Хагая Марона представили три новых метода для обнаружения галлюцинаций и других сбоев в больших языковых моделях. Вместо того чтобы просто смотреть на финальный ответ, инструменты анализируют внутренние сигналы: паттерны активаций, карты внимания и распределения вероятностей.

🧠 Три инструмента

- ACT-ViT (NeurIPS 2025): обрабатывает тензоры активаций со всех слоёв и токенов с помощью Vision Transformer. Показал прирост до +37 AUC на некоторых бенчмарках.
- CHARM (ICLR 2026): строит графы внимания и применяет графовые нейросети, чтобы предсказывать галлюцинации на уровне отдельных токенов.
- LOS-Net (AAAI 2026): работает только с выходными вероятностями (logprobs), не требуя доступа к внутренностям модели. Это самый лёгкий для внедрения вариант, особенно для API-сценариев.

🔍 Практическая ценность

Для 95% пользователей ChatGPT, Claude или Gemini эти инструменты бесполезны — провайдеры не дают доступ к активациям или attention maps. Но если вы сами разворачиваете открытые LLM, LOS-Net можно запустить уже сегодня. Он использует лишь top-K логитов (K=10..20) и работает в 5 раз быстрее аналогов на вспомогательных моделях.

📎 Ссылки
- ACT-ViT: https://github.com/BarSGuy/ACT-ViT
- LOS-Net: https://github.com/BarSGuy/LLM-Output-Signatures-Network
- CHARM: публичного репозитория пока нет

💡 Вывод
Для инженеров, хостящих свои LLM, LOS-Net — это готовый инструмент для внутреннего аудита. Для всех остальных — напоминание, что проблема галлюцинаций решается, но не для закрытых API.

#LOS-Net #детект_галлюцинаций #Technion #logprobs #LLM_безопасность #QixNewsAI #Shorts

Видео 🧐👉 Твой ChatGPT врёт, а ты не видишь: инструменты Technion ловят галлюцинации изнутри #QixNewsAI канала QixNews Экспресс Информ

LLM_безопасность LOS-Net QixNewsAI Shorts Technion logprobs детект_галлюцинаций

Комментарии отсутствуют

Информация о видео

18 июня 2026 г. 16:41:08

00:00:31

QixNews Экспресс Информ

Теги

Правообладателям

Жалоба на материал Недопустимый материал Нарушение авторских прав

Комментарии

Другие видео канала

🧐👉 Твой ChatGPT врёт, а ты не видишь: инструменты Technion ловят галлюцинации изнутри #QixNewsAI

🧐👉 Pixel 9 Pro без Gemini Intelligence: жесткая правда об Android 17 #QixNewsAI

🧐👉 397B AI модель за $2500: почему это не замена облаку #QixNewsAI

🧐👉 Google Vids бесплатно: почему Extend снижает качество видео #QixNewsAI

🧐👉 Почему $8 млн в крипте не спасли от AR-15: похищение в Миннесоте #QixNewsCrypto

🧐👉 Snap Specs за $2195: AR-очки, которые не стыдно надеть? #QixNewsAI

🧐👉 15 лет без диагноза: как ИИ за неделю нашел причину болезни #QixNewsAI

🧐👉 Google Calendar получил 200 цветов, а Voice — ИИ-заметки: что пробовать, а что нет #QixNewsAI

🧐👉 AI-напарник в PUBG: говорит, но стреляет как бот — тест за вас #QixNewsAI

🧐👉 Почему Банк Японии поднял ставку до 1%, а биткоин и Nikkei взлетели #QixNewsCrypto

🧐👉 Tether убил aUSDT: почему провалился «золотой» стейблкоин, о котором никто ... #QixNewsCrypto

Новости блокчейна: пятница, 19 июня 2026 г. в 13:48 #QixNewsCrypto

🧐👉 Claude Design заменяет Figma для прототипов: одна команда вместо трех инструментов #QixNewsAI

🧐👉 Codex теперь делает за тебя рутину: запись действий на Mac #QixNewsAI

🧐👉 DeepSeek научился «видеть», но не узнал своего создателя. Стоит ли пробовать? #QixNewsAI

🧐👉 Amazon вложил $50 млрд в OpenAI и тут же слил фильм про Альтмана — совпадение? #QixNewsAI

🧐👉 Почему сын Трампа втянут в иск против криптоплатформ на миллиарды #QixNewsCrypto

🧐👉 Musk обещает: через 3 месяца ты будешь командовать Tesla как таксистом. Но ... #QixNewsAI

🧐👉 Alibaba догнала NVIDIA: роботы учатся на открытых моделях #QixNewsAI

🧐👉 Один и тот же ИИ, разная оболочка — разрыв в 13% #QixNewsAI

🧐👉 DeepSeek заставила инвесторов подписать запрет на хантинг: что это значит для ... #QixNewsAI

🧐👉 Pixel 9 Pro XL с 16 ГБ ОЗУ не получил Gemini Intelligence: Google заставляет ... #QixNewsAI