Новостная лента об искусственном интеллекте и машинном обучении

Главные новости и публикации каждый день! Будьте на шаг впереди: узнавайте первыми про новые идеи, тренды и инновации в сфере технологий.

Раскрытие аномалий: Сравнительный анализ методов обнаружения выбросов

В этой статье рассматриваются алгоритмы машинного обучения для выявления выбросов и их применение к статистике биты Главной лиги бейсбола на 2023 год. Сравниваются четыре алгоритма: Elliptic Envelope, Local Outlier Factor, One-Class Support Vector Machine with Stochastic Gradient Descent и Isolation Forest. Цель - получить представление об их поведении и ограничениях, чтобы определить, какой а...

Учет рыбы в плотинах гидроэлектростанций: Учет сложностей и взаимодействие с заинтересованными сторонами

В этой статье рассматриваются сложности подсчета рыбы, проходящей через крупные плотины гидроэлектростанций, и проблемы координации работы по созданию наборов данных с участием человека. В ней подчеркивается важность соблюдения правил, установленных Федеральной комиссией по регулированию энергетики, и потенциальное влияние плотин гидроэлектростанций на популяции рыб.

Сила экспоненциальной скользящей средней: Понимание анализа временных рядов

В этой статье рассматривается логика, лежащая в основе фундаментального алгоритма градиентного спуска, и особое внимание уделяется экспоненциальной скользящей средней. В ней рассматривается мотивация метода, его формула и математическая интерпретация распределения весов.

Оптимизация настроек компилятора Rust для максимальной производительности

В этой статье рассказывается о том, как проводить бенчмаркинг с помощью крейта criterion и как проводить бенчмаркинг с различными настройками компилятора, что позволяет получить представление о влиянии производительности и провести сравнение между процессорами. В качестве примера используется крейт range-set-blaze для измерения настроек SIMD, уровней оптимизации и различных длин входных данных.

Раскрытие потенциала ML: Создание решений без кода с помощью Amazon DocumentDB и SageMaker Canvas

Компания Amazon объявила об интеграции Amazon DocumentDB с Amazon SageMaker Canvas, позволяющей пользователям строить ML-модели без кодирования. Эта интеграция позволяет компаниям анализировать неструктурированные данные, хранящиеся в Amazon DocumentDB, и создавать прогнозы, не прибегая к услугам специалистов по разработке данных и науке о данных.

Ускорение кода Rust с помощью SIMD: 9 правил для ускорения (часть 2)

В 7 раз увеличиваем потребление данных в range-set-blaze Crate за счет делегирования вычислений маленьким крабам. Правило 7: используйте критериальный бенчмаркинг для выбора алгоритма и обнаружите, что LANES (почти) всегда должен быть 32 или 64.

Создайте свой собственный тренажерный зал искусственного интеллекта: Погружение в глубокое Q-обучение

Погрузитесь в мир искусственного интеллекта и создайте тренажер глубокого обучения с подкреплением с нуля. Получите практический опыт и создайте свой собственный тренажер для обучения агента решению простой задачи, заложив основу для создания более сложных сред и систем.

Автоматизируйте предварительную маркировку PDF с помощью AWS: Оптимизация подготовки учебных данных для Amazon Comprehend

Amazon Comprehend предлагает предварительно обученные и пользовательские API для обработки естественного языка. Они разработали инструмент предварительной маркировки, который автоматически аннотирует документы, используя существующие табличные данные о сущностях, сокращая ручную работу, необходимую для обучения точных пользовательских моделей распознавания сущностей.

Раскрытие возможностей RAG: усиление стабильной диффузии текста к изображениям

Генерация текста в изображения - быстро развивающаяся область ИИ, а Stable Diffusion позволяет пользователям создавать высококачественные изображения за считанные секунды. Использование технологии Retrieval Augmented Generation (RAG) улучшает подсказки для моделей Stable Diffusion, позволяя пользователям создать собственного помощника ИИ для генерации подсказок.

Повышение эффективности рабочего процесса ML: Представление пространств SageMaker Studio и инструментов генеративного ИИ

Amazon SageMaker Studio теперь предлагает полностью управляемый редактор кода на базе Code-OSS, а также JupyterLab и RStudio, позволяя разработчикам ML настраивать и масштабировать свои IDE с помощью гибких рабочих пространств, называемых Spaces. Эти пространства обеспечивают постоянное хранение и конфигурации времени выполнения, повышая эффективность рабочего процесса и позволяя легко интегри...

Дебаты о разведке: раскрытие истины, скрывающейся за ChatGPT

ChatGPT от OpenAI, новаторская языковая модель ИИ, вызвала восторг своими впечатляющими способностями, в том числе отличными результатами на экзаменах и игрой в шахматы. Однако скептики утверждают, что настоящий интеллект не следует путать с запоминанием, что привело к появлению научных исследований, изучающих это различие и выдвигающих аргументы против AGI.

Революционный мониторинг горного оборудования с помощью AWS-прототипирования и компьютерного зрения

ICL, международная производственная и горнодобывающая корпорация, разработала собственные возможности машинного обучения и компьютерного зрения для автоматического мониторинга своего горнодобывающего оборудования. При поддержке программы AWS Prototyping они смогли создать на AWS фреймворк с использованием Amazon SageMaker для извлечения изображения с 30 камер с возможностью масштабирования до ...

Революция в области рекомендаций вакансий: Упорядоченная обработка данных Talent.com с помощью Amazon SageMaker

Компания Talent.com в сотрудничестве с AWS разработала систему рекомендаций по работе с использованием глубокого обучения, которая обрабатывает 5 миллионов ежедневных записей менее чем за 1 час. Система включает в себя разработку функций, проектирование архитектуры модели глубокого обучения, оптимизацию гиперпараметров и оценку модели, и все это выполняется на Python.

Раскрытие возможностей спектральной кластеризации: Эффективные методы преобразования собственных векторов в метки кластеров

В статье рассматриваются распространенные методы кластеризации данных с акцентом на спектральную кластеризацию. Использование k-средних для вычисления кластерных меток из собственных векторов оказывается наилучшим подходом, несмотря на вариации и сложности.

Разблокирование влияния: Преодоление препятствий в проектах по работе с данными

Проекты по работе с данными часто не приносят реальной отдачи из-за таких макроэлементов, как доступность данных, набор навыков, сроки, готовность организации и политическая обстановка. Наличие и доступность соответствующих данных являются основополагающими факторами, и если они недоступны, следует пересмотреть целесообразность проекта.