Все новости

Как я мерил точность ИИ в распознавании еды: бенчмарк, LLM-as-judge и баг с варёной гречкой

Строю приложение для подсчёта калорий по фото. Пользователь снимает тарелку, модель определяет блюдо, считает КБЖУ. Идея не новая, но мне важно, чтобы это работало именно на русской еде — борщи, гречки, котлеты по-домашнему. В какой-то момент стало некомфортно: я не знал, насколько модель вообще точна. «Кажется, работает нормально» — плохой ответ, если хочешь что-то улучшать. Решил померять…

ИИ #LLM #Gemini #бенчмарк #распознавание еды

Мы вскрыли трафик ChatGPT, Gemini и DeepSeek, чтобы понять, откуда берутся «источники» в ответах

Когда нейросеть отвечает на вопрос и показывает блок «источников», кажется, что у всех систем это одно и то же — список ссылок, на которые модель опиралась. На деле за этим блоком в каждой системе стоит своя реализация: свой способ обмена с сервером, свой формат ответа, свои поля, из которых интерфейс достаёт цитаты. Мы разобрали сетевой обмен веб-клиентов трёх систем — ChatGPT, Gemini и DeepSeek…

Сводка ИИ In mehreren Publikationen werden verschiedene Aspekte von KI-Assistenten wie ChatGPT, Gemini und DeepSeek thematisiert. Ein Bericht analysiert die technischen Unterschiede in der Quellenangabe dieser Systeme, während andere Artikel die Nutzung im Smart Home, die Migration von Nutzerdaten zwischen den Diensten und einen spezifischen Trend zur Bildgenerierung für die Fußball-Weltmeisterschaft behandeln. Die Themen sind breit gefächert, betreffen jedoch alle die genannten KI-Plattformen.

ИИ #ChatGPT #LLM #Gemini #deepseek

Смогут ли LLM выжить во время катастрофы? Gemini, ChatGPT и другие играют в «Бункер» (анализ поведения)

Тестирование современных LLM моделей проводится с помощью стандартных бенчмарков, которые оценивают математические способности, программирование, понимание текста или умение строить логические выводы. Однако эти тесты слабо отражают умение моделей вести переговоры, адаптироваться к ситуации и выстраивать социальные взаимодействия. Давайте выйдет за рамки сухих метрик и поместим нейросети в…

ИИ #ChatGPT #искусственный интеллект #LLM #Gemini