Salesforce грозит потерять 48 миллиардов долларов рыночной стоимости на фоне опасений по поводу низкого прогноза роста выручки и конкуренции со стороны конкурирующих предложений в области искусственного интеллекта. Акции компании упали на 18 % после того, как квартальные результаты впервые за 15 лет оказались ниже ожиданий.
Дата-центры больших технологий вносят основной вклад в глобальные парниковые выбросы, превосходя по этому показателю коммерческие авиарейсы. Мариана Маццукато призывает внимательно изучить влияние технологий на окружающую среду, обращая особое внимание на такие энергоемкие технологии, как ChatGPT.
ИИ может обеспечить реальное межвидовое общение, поскольку Тель-Авивский университет присоединился к конкурсу Coller Dolittle Challenge стоимостью 10 млн долларов. Ученым предлагается создать двусторонние разговоры с животными в рамках революционного конкурса.
Популярная большая языковая модель Llama от Meta AI сталкивается с проблемами при обучении, но при правильном масштабировании и использовании лучших практик на AWS Trainium можно добиться сопоставимого качества. Распределенное обучение на 100+ узлах - сложная задача, но кластеры Trainium обеспечивают экономию средств, эффективное восстановление и повышенную стабильность при обучении LLM.
Крупные языковые модели, такие как GPT и BERT, опираются на архитектуру Transformer и механизм самовнимания для создания контекстуально насыщенных вкраплений, что произвело революцию в НЛП. Статические вкрапления, такие как word2vec, не справляются с захватом контекстуальной информации, что подчеркивает важность динамических вкраплений в языковых моделях.
Мультимодальные модели, такие как Claude3 и GPT-4V, объединяют текст и изображения для улучшения понимания. Тонкая настройка LLaVA на данных, специфичных для конкретной области, повышает производительность в различных отраслях.
Непрерывная интеграция (CI) и непрерывная поставка (CD) преобразуют разработку машинного обучения (ML), способствуя сотрудничеству, повышению качества кода и раннему обнаружению проблем. Автоматизированные процессы в MLOps обеспечивают стабильную работу модели и ускоряют итерации для эффективной разработки ML-моделей.
Бывший член совета директоров OpenAI удивлен публичным выходом ChatGPT в Twitter и сменой фокуса компании. Также обсуждаются события, связанные с увольнением и повторным наймом генерального директора Сэма Альтмана.
OpenAI столкнулась с негативной реакцией Скарлетт Йоханссон из-за нового чатбота Sky, похожего на ее героиню в фильме «Она». Глобальный саммит по ИИ в Южной Корее и доклад Института Алана Тьюринга о влиянии ИИ на выборы. Алекс Херн из Guardian обсуждает последние достижения в области ИИ с Мадлен Финлей на BBC News.
ИИ-агенты, такие как ChatGPT, доказывают компетентность ИИ на уровне человека. Система Agent Engineering Framework направлена на разработку эффективных агентов ИИ.
Ученые из Массачусетского технологического института и Лаборатории искусственного интеллекта MIT-IBM Watson разработали новый подход, позволяющий научить компьютеры точно определять действия на видео, используя только транскрипты. Этот метод, названный пространственно-временным обоснованием, повышает точность определения действий на длинных видео и может найти применение в онлайн-обучении и зд...
Адаптация к доменам для LLM в серии из 3 частей. Узнайте, как модели ИИ пытаются выйти за пределы своей «зоны комфорта».
Google использует разрешение сущностей для сопоставления товаров на разных платформах, помогая компаниям электронной коммерции анализировать конкурентов и сравнивать цены. Система Entity Resolution (ER) помогает обнаруживать дубликаты объявлений и устанавливать конкурентоспособные цены в розничной торговле.
OpenAI создает комитет по безопасности для принятия важных решений. Новая модель искусственного интеллекта разрабатывается для замены системы ChatGPT.
Phi-3 от Microsoft создает небольшие оптимизированные модели классификации текста, превосходящие более крупные модели, такие как GPT-3. Генерация синтетических данных с помощью Phi-3 через Ollama улучшает рабочие процессы ИИ для конкретных случаев использования, предлагая понимание классификации «кликабельного» и фактического контента.