- Популярные видео
- Авто
- Видео-блоги
- ДТП, аварии
- Для маленьких
- Еда, напитки
- Животные
- Закон и право
- Знаменитости
- Игры
- Искусство
- Комедии
- Красота, мода
- Кулинария, рецепты
- Люди
- Мото
- Музыка
- Мультфильмы
- Наука, технологии
- Новости
- Образование
- Политика
- Праздники
- Приколы
- Природа
- Происшествия
- Путешествия
- Развлечения
- Ржач
- Семья
- Сериалы
- Спорт
- Стиль жизни
- ТВ передачи
- Танцы
- Технологии
- Товары
- Ужасы
- Фильмы
- Шоу-бизнес
- Юмор
@Google:Google 釋出 Gemma 4 開放模型強化視覺辨識能力。 Google 近期發布了迄今最強大的開放模型「Gemma 4」,自推出以來下載量已突破 1…
Google 釋出 Gemma 4 開放模型強化視覺辨識能力。
Google 近期發布了迄今最強大的開放模型「Gemma 4」,自推出以來下載量已突破 1.5 億次。該模型不僅支援多 token 預測(Multi-Token Prediction)以加速推論,還提供 12B Unified 模型與量化感知訓練(QAT)檢查點,並採用 Apache 2.0 授權,讓開發者能靈活地在邊緣裝置或本地工作站進行微調與部署。
視覺問答與角色扮演
開發者 @measure_plan 利用 Gemma 4 的視覺語言能力,透過特定提示詞(prompt)讓模型扮演「中世紀吟遊詩人」。在實際操作中,模型能精準識別環境中的物件(如「琥珀色液體的玻璃杯」或「裝滿書籍的書架」),並持續以吟遊詩人的語氣進行描述,即便在展示不同物品時也能維持角色設定,展現出色的視覺推理與語境保持能力。
一名男子在鏡頭前展示物品,同時螢幕顯示即時物件偵測與 AI 生成的文字描述。
長文本記憶與遊戲化應用
開發者 @GOROman 則利用 Gemma 4 高達 256K 的視窗(context window),開發了一款將現實世界轉化為冒險遊戲的應用程式。由於大型語言模型具備龐大的記憶容量,該應用程式能有效儲存並回顧遊戲世界中近期發生的長篇歷史紀錄,這對於需要高度情境連貫性的遊戲體驗至關重要。
一位使用者正在使用手機上的 AR 應用程式,透過相機鏡頭即時掃描並獲取街道場景的文字描述。
邊緣運算與隱私保護
HubX 團隊開發的 AI 英語家教平台「BetterSpeak」,採用了針對邊緣運算優化的 Gemma 4 E2B(20 億參數)模型作為推理引擎。該方案具備以下技術特點:
部署 4-bit 量化版本:透過壓縮模型大小,成功克服行動裝置的硬體限制。
離線運作:無需網路連線即可處理語法解釋與跨語言進度監控,確保使用者隱私。
原生音訊輸入:支援直接的語音對語音(speech-to-speech)學習,降低運算成本並提升互動效率。
目前開發者可透過 iOS 或 Android 平台的「Google AI Edge Gallery」體驗 Gemma 4,或直接前往 Google AI Studio 進行探索。
這是一張手機應用程式介面的截圖,顯示使用者正在確認下載離線學習資源包的彈出視窗。
更多技術細節可參考 官方說明文件 。
一名男子在鏡頭前展示物品,同時螢幕顯示即時物件偵測與 AI 生成的文字描述。 影片中的 Prompt 與操作:
操作步驟: 1. @00:02 男子拿起一根香蕉。 2. @00:11 男子拿起一個裝有琥珀色液體的玻璃杯。 3. @00:18 男子拿起一個藍色公仔。 4. @00:20 男子拿起手機,螢幕顯示時間 5:05。 5. @00:27 男子對鏡頭比出勝利手勢。
一位使用者正在使用手機上的 AR 應用程式,透過相機鏡頭即時掃描並獲取街道場景的文字描述。 影片中的 Prompt 與操作:
操作步驟: 1. (00:00)點擊螢幕上的「しらべる」按鈕 2. (00:04)系統顯示第一段街道場景描述 3. (00:11)點擊螢幕上的「しらべる」按鈕 4. (00:13)系統顯示第二段街道場景描述
原文:https://easyvibecoding.app/curated/2058
Видео @Google:Google 釋出 Gemma 4 開放模型強化視覺辨識能力。 Google 近期發布了迄今最強大的開放模型「Gemma 4」,自推出以來下載量已突破 1… канала easyvibecoding
Google 近期發布了迄今最強大的開放模型「Gemma 4」,自推出以來下載量已突破 1.5 億次。該模型不僅支援多 token 預測(Multi-Token Prediction)以加速推論,還提供 12B Unified 模型與量化感知訓練(QAT)檢查點,並採用 Apache 2.0 授權,讓開發者能靈活地在邊緣裝置或本地工作站進行微調與部署。
視覺問答與角色扮演
開發者 @measure_plan 利用 Gemma 4 的視覺語言能力,透過特定提示詞(prompt)讓模型扮演「中世紀吟遊詩人」。在實際操作中,模型能精準識別環境中的物件(如「琥珀色液體的玻璃杯」或「裝滿書籍的書架」),並持續以吟遊詩人的語氣進行描述,即便在展示不同物品時也能維持角色設定,展現出色的視覺推理與語境保持能力。
一名男子在鏡頭前展示物品,同時螢幕顯示即時物件偵測與 AI 生成的文字描述。
長文本記憶與遊戲化應用
開發者 @GOROman 則利用 Gemma 4 高達 256K 的視窗(context window),開發了一款將現實世界轉化為冒險遊戲的應用程式。由於大型語言模型具備龐大的記憶容量,該應用程式能有效儲存並回顧遊戲世界中近期發生的長篇歷史紀錄,這對於需要高度情境連貫性的遊戲體驗至關重要。
一位使用者正在使用手機上的 AR 應用程式,透過相機鏡頭即時掃描並獲取街道場景的文字描述。
邊緣運算與隱私保護
HubX 團隊開發的 AI 英語家教平台「BetterSpeak」,採用了針對邊緣運算優化的 Gemma 4 E2B(20 億參數)模型作為推理引擎。該方案具備以下技術特點:
部署 4-bit 量化版本:透過壓縮模型大小,成功克服行動裝置的硬體限制。
離線運作:無需網路連線即可處理語法解釋與跨語言進度監控,確保使用者隱私。
原生音訊輸入:支援直接的語音對語音(speech-to-speech)學習,降低運算成本並提升互動效率。
目前開發者可透過 iOS 或 Android 平台的「Google AI Edge Gallery」體驗 Gemma 4,或直接前往 Google AI Studio 進行探索。
這是一張手機應用程式介面的截圖,顯示使用者正在確認下載離線學習資源包的彈出視窗。
更多技術細節可參考 官方說明文件 。
一名男子在鏡頭前展示物品,同時螢幕顯示即時物件偵測與 AI 生成的文字描述。 影片中的 Prompt 與操作:
操作步驟: 1. @00:02 男子拿起一根香蕉。 2. @00:11 男子拿起一個裝有琥珀色液體的玻璃杯。 3. @00:18 男子拿起一個藍色公仔。 4. @00:20 男子拿起手機,螢幕顯示時間 5:05。 5. @00:27 男子對鏡頭比出勝利手勢。
一位使用者正在使用手機上的 AR 應用程式,透過相機鏡頭即時掃描並獲取街道場景的文字描述。 影片中的 Prompt 與操作:
操作步驟: 1. (00:00)點擊螢幕上的「しらべる」按鈕 2. (00:04)系統顯示第一段街道場景描述 3. (00:11)點擊螢幕上的「しらべる」按鈕 4. (00:13)系統顯示第二段街道場景描述
原文:https://easyvibecoding.app/curated/2058
Видео @Google:Google 釋出 Gemma 4 開放模型強化視覺辨識能力。 Google 近期發布了迄今最強大的開放模型「Gemma 4」,自推出以來下載量已突破 1… канала easyvibecoding
Комментарии отсутствуют
Информация о видео
Вчера, 17:45:13
00:02:25
Другие видео канала





















