Инструменты искусственного интеллекта Apple могут переписывать тексты и электронные письма, но лингвисты предупреждают о потере нюансов и характера. Технология призвана сделать речь пользователей более дружелюбной или профессиональной.
Берлинская компания Vay предлагает уникальный сервис теледрайвинга с использованием технологии NVIDIA для безопасного дистанционного управления автомобилем в режиме реального времени. Vay изменяет мобильность с помощью автономного вождения, управляемого человеком и определяемого искусственным интеллектом, устанавливая новый стандарт в городском транспорте.
Ученым, изучающим данные и переходящим на руководящие должности, необходимы такие бизнес-навыки, как свободное владение финансовыми терминами, для реализации эффективных инициатив в области данных. Понимание финансовых терминов может помочь в разработке новых идей, повысить успех компании и даже договориться о более высокой зарплате. Знание цифр открывает двери для таких возможностей, как нало...
Новая модель OpenAI o1 превосходит ChatGPT-40. Эксперимент с ChatGPT-o1 для генерации кода на Python дает точность 90 %.
Масштабируемые симуляции с OpenUSD и NVIDIA Omniverse способствуют развитию робототехники, позволяя проводить реалистичные испытания и обучение ИИ в виртуальных средах. Такие компании, как Cobot и Field AI, используют Isaac Sim для проверки производительности роботов и создания моделей ИИ для различных приложений.
Исследователи Массачусетского технологического института разработали систему, использующую большие языковые модели для преобразования сложных объяснений ИИ в простой язык, что улучшает понимание пользователя. Система оценивает качество изложения, позволяя пользователям доверять предсказаниям машинного обучения и настраивать объяснения под конкретные нужды.
Pixtral 12B, передовая модель языка зрения от Mistral AI, превосходит другие модели при решении текстовых и мультимодальных задач. Она имеет новую архитектуру с 400-миллионным кодировщиком зрения и 12-миллиардным декодером трансформации, обеспечивая высокую производительность и скорость понимания изображений и документов.
Sora от OpenAI, генератор текста в видео, который теперь доступен для всех в США, создает видеоролики ИИ на основе написанных подсказок. Пользователи могут увидеть, как их подсказки оживают, подобно семейству шерстистых мамонтов в открытой пустыне, благодаря инновационной технологии Sora.
Большие языковые модели, такие как ChatGPT, быстро развиваются, но могут проявлять политическую предвзятость. Исследование MIT ставит вопрос о том, могут ли модели вознаграждения быть одновременно правдивыми и непредвзятыми.
Федеральная полиция Австралии полагается на ИИ в расследованиях из-за огромного объема данных. В среднем анализируется 40 терабайт данных, а сообщения о киберинцидентах поступают каждые 6 минут.
Даниэла Рус из Массачусетского технологического института получила премию Джона Скотта 2024 года за новаторские исследования в области робототехники, которые позволили переопределить возможности роботов, выходящие за рамки традиционных норм. Работа Рус сосредоточена на разработке объяснимых алгоритмов для создания совместных роботов, способных решать реальные задачи, подчеркивая синергию между...
Исследователи MIT CSAIL разработали ContextCite, инструмент для повышения доверия к контенту, создаваемому ИИ, путем определения внешних источников контекста. Этот инструмент помогает пользователям проверять утверждения, отслеживать ошибки в источниках и выявлять галлюцинации.
Реализовал регрессию AdaBoost с нуля на Python, изучая деревья решений и компоненты k-nearest neighbors. Нашел оригинальный исходный документ для AdaBoost. Алгоритм R2, столкнувшийся с трудным, но полезным инженерным процессом.
Краткое содержание: Узнайте три незатратных решения для эффективного повышения качества данных. Используйте старые приемы работы с базами данных, создавайте пользовательские информационные панели и генерируйте данные с помощью Python. Упростите процессы и уменьшите сложность для повышения качества данных.
Два подхода к изучению мультимодальных данных: сначала внедрить, потом сделать вывод с помощью Amazon Titan Multimodal Embeddings и сначала сделать вывод, потом внедрить с помощью Anthropic's Claude 3 Sonnet. Оценка с помощью набора данных SlideVQA, предоставляющего краткие ответы на вопросы пользователей.