Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий

Разгадать силу сложных предложений: Как мозг реагирует на необычный язык

Нейробиологи из Массачусетского технологического института обнаружили, что предложения с необычной грамматикой или неожиданным смыслом вызывают более сильную реакцию в центрах обработки языка мозга, в то время как простые предложения практически не задействуют эти области. Исследователи использовали искусственную языковую сеть, чтобы предсказать реакцию мозга на различные предложения.

Раскрытие "черного ящика": ИИ в здравоохранении и одобрение FDA

В клинике MIT Abdul Latif Jameel Clinic for Machine Learning in Health обсуждался вопрос о том, следует ли полностью объяснять "черный ящик" процесса принятия решений моделями ИИ для получения разрешения FDA. Мероприятие также подчеркнуло необходимость образования, доступности данных и сотрудничества между регулирующими органами и медицинскими специалистами при регулировании ИИ в здравоохранении.

Эффективное решение сложных физических систем: Сила улучшенных физикой глубинных суррогатов

Исследователи из Массачусетского технологического института и компании IBM разработали новый метод под названием "глубокий суррогат с усилением физики" (PEDS), который объединяет физический симулятор низкой точности с генератором нейронных сетей для создания управляемых данными суррогатных моделей для сложных физических систем. Метод PEDS является доступным, эффективным и позволяет сократить о...

Unlocking Cypher Generation: Методы тонкой настройки ИИ преобразования текста в шифр

В этой статье рассматриваются методы создания наборов данных тонкой настройки для генерации запросов на языке Cypher из текста с использованием больших языковых моделей (LLM) и предопределенной схемы графа. Автор также упоминает о текущем проекте, целью которого является разработка всеобъемлющего набора данных для тонкой настройки с использованием подхода "человек в цикле".

Революция в выявлении рака поджелудочной железы: ИИ предсказывает пациентов с высоким риском с беспрецедентной точностью

Ученые Массачусетского технологического института разработали две модели машинного обучения - нейронную сеть "PRISM" и модель логистической регрессии - для раннего выявления рака поджелудочной железы. Эти модели превзошли существующие методы, обнаружив 35 % случаев по сравнению со стандартным показателем в 10 %.

Баланс между исследованием и эксплуатацией: Стратегия приборных панелей для менеджеров по аналитике

Разработчики видеоигр с открытым миром и менеджеры по аналитике сталкиваются с проблемой баланса между исследованием и эксплуатацией. Чтобы решить эту проблему, они могут строить альтернативные пути, предлагать системы управления знаниями, создавать онлайн-сообщества и постоянно вносить улучшения. У продавцов, как и у геймеров, есть основные задачи в виде конкретных показателей, которые они до...

Переосмысление жилья: Решение проблемы неравенства с помощью инновационных исследований

MIT Policy Hackathon объединяет студентов и профессионалов со всего мира для решения социальных проблем с помощью инструментов генеративного ИИ, таких как ChatGPT. Команда-победитель "Ctrl+Alt+Defeat" занимается решением проблемы выселения в США.

Раскрытие возможностей GPT-1: глубокое погружение в первую версию революционной языковой модели

В 2017 году Google Brain представил Transformer - гибкую архитектуру, которая превзошла существующие подходы к глубокому обучению и теперь используется в таких моделях, как BERT и GPT. GPT, модель декодера, использует задачу языкового моделирования для генерации новых последовательностей и следует двухэтапной схеме предварительного обучения и тонкой настройки.

Раскрытие влияния контекстных окон на модели трансформеров

В статье обсуждается важность понимания контекстных окон при обучении и использовании трансформеров, особенно с появлением проприетарных LLM и таких техник, как RAG. В ней рассматривается, как различные факторы влияют на максимальную длину контекста, которую может обработать модель трансформатора, и задается вопрос, всегда ли больше - значит лучше.

OpenAI представила потенциальное решение проблемы "лени" ИИ в модели ChatGPT-4

OpenAI представляет обновления моделей ИИ ChatGPT, устраняя проблему "лени" в GPT-4 Turbo и выпуская новую модель GPT-3.5 Turbo с более низкой ценой. Пользователи сообщали о снижении глубины выполнения заданий в ChatGPT-4, что побудило OpenAI принять ответные меры.

Создайте собственный пользовательский ИИ-помощник с помощью OpenAI GPT: Пошаговое руководство

Компания OpenAI выпустила простой в использовании веб-инструмент для создания собственных ИИ-помощников без кодирования, для чего требуется только учетная запись Google или Microsoft и подписка OpenAI Plus на 20 долларов в месяц. Пользователи могут персонализировать имя, изображение, тон и стиль взаимодействия своего ИИ-помощника, а также расширить его знания, загрузив определенные документы.

Использование возможностей LLM-рецептов данных

В этой статье рассматриваются ограничения, связанные с использованием больших языковых моделей (LLM) для анализа разговорных данных, и в качестве альтернативы предлагается методология "Рецепты данных". Эта методология позволяет создать библиотеку рецептов данных многократного использования, что улучшает время отклика и позволяет внести свой вклад в развитие сообщества.

Раскрытие потенциала заявок на получение степени магистра: Уроки и стратегии успеха

Разработка приложений для LLM может быть одновременно интересной и сложной задачей, поскольку при этом необходимо учитывать безопасность, производительность и стоимость. Если начать с приложений с низким уровнем риска и придерживаться политики "сначала дешевые LLM", это поможет снизить риски и сократить объем работ, необходимых для запуска.

Защита генеративного ИИ: архитектура глубокой защиты для приложений LLM

Генеративные приложения ИИ, использующие большие языковые модели (БЯМ), имеют большую экономическую ценность, но управление безопасностью, конфиденциальностью и соответствием нормативным требованиям имеет решающее значение. В этой статье представлены рекомендации по устранению уязвимостей, внедрению передовых методов обеспечения безопасности и разработке стратегий управления рисками для прилож...

Освоение монокулярной оценки глубины: Техники и оценка

В этой статье рассматривается монокулярная оценка глубины (MDE) и ее важность для приложений компьютерного зрения. В ней рассказывается о том, как загрузить и визуализировать данные карты глубины, выполнить вывод с помощью Marigold и DPT, а также оценить прогнозы глубины с помощью набора данных SUN RGB-D.