Світові новини про штучний інтелект та машинне навчання

Qudata

Червень 11, 2025

Відродити своє мистецтво: Реставрація масок зі штучним інтелектом за лічені години

Аспірант Массачусетського технологічного інституту Алекс Качкін розробляє метод фізичного нанесення цифрової реставрації на оригінальні картини, що прискорює процес у 66 разів. Його інноваційний підхід дозволяє вести чіткий цифровий облік реставраційних змін, потенційно повертаючи більше пошкоджених творів мистецтва до уваги громадськості.

ДІЗНАТИСЯ БІЛЬШЕ

Червень 11, 2025

Перемога поспіль: NVIDIA перемагає в конкурсі автономного водіння

NVIDIA другий рік поспіль перемагає в Autonomous Grand Challenge на CVPR. Представляємо узагальнену оцінку траєкторії для розумніших і безпечніших AV.

ДІЗНАТИСЯ БІЛЬШЕ

Червень 6, 2025

Покращуйте пошук відео за допомогою штучного інтелекту в Amazon SageMaker

Семантичний пошук відео з використанням моделей машинного зору дозволяє користувачам шукати відеоконтент за допомогою запитів на природній мові, покращуючи виявлення та модерацію контенту. Великі моделі зору, такі як CLIP, дозволяють переносити дані з нульового кадру на різні завдання комп'ютерного зору, революціонізуючи ефективність відеопошуку.

ДІЗНАТИСЯ БІЛЬШЕ

Червень 2, 2025

Підвищуємо навички малювання за допомогою ШІ: Навчання мистецтву малювання, схожого на людину

Массачусетський технологічний інститут та Стенфордський університет розробляють SketchAgent - систему штучного інтелекту, яка створює ескізи штрих за штрихом на основі підказок природною мовою. Інструмент має на меті докорінно змінити спосіб спілкування людини зі штучним інтелектом завдяки більш природному та ітеративному процесу малювання.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 22, 2025

ШІ відкриває зв'язок між зором і звуком

Researchers from MIT improve AI model's ability to learn like humans, connecting audio and visual data without human labels. Method enhances accuracy in video retrieval tasks and action classification in audiovisual scenes, opening new applications.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 21, 2025

Максимізуйте потужність графічного процесора за допомогою PyTorch

Дізнайтеся, як використовувати потужність вашого графічного процесора Nvidia за допомогою PyTorch, бібліотеки машинного навчання, оптимізованої для роботи з графічними процесорами. Підтримка CUDA в PyTorch дозволяє ефективно маніпулювати тензорами, що робить її ідеальною для високонавантажених обчислювальних задач, які виходять за рамки ML.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 16, 2025

Оптимізація розробки штучного інтелекту за допомогою SiMa.ai Edgematic та інтеграції з AWS

SiMa.ai та AWS співпрацюють для ефективного розгортання моделей ML на периферії за допомогою Amazon SageMaker AI та Palette Edgematic. Виявляйте присутність людей та захисне обладнання в режимі реального часу на периферійних пристроях для підвищення безпеки на робочому місці за допомогою оптимізованих моделей виявлення об'єктів.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 15, 2025

ШІ революціонізує прогнозування розташування білків у клітинах людини

Новий обчислювальний підхід прогнозує розташування білків у клітинах, допомагаючи в діагностиці захворювань та ідентифікації мішеней для ліків. Дослідники з Массачусетського технологічного інституту, Гарварду та Інституту Броуда розробили метод локалізації одноклітинних білків за допомогою моделей штучного інтелекту.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 14, 2025

Заперечення нівелює успіх візійно-мовної моделі

Моделі мови зору борються із запереченням, що впливає на точність. Дослідники Массачусетського технологічного інституту закликають бути обережними у використанні цих моделей наосліп.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 7, 2025

Освоєння перетворення кольорів: RGB в HSV

Розуміння зберігання та представлення зображень є ключовим у комп'ютерному зорі. Кольорові моделі RGB та HSV надають цінну інформацію для обробки зображень у Python з використанням OpenCV.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 1, 2025

Побудова довіри: Штучний інтелект на високих ставках

ШІ-модель допомагає лікарям у медичній візуалізації, генеруючи менші та надійніші набори прогнозів, що підвищує ефективність діагностики. Дослідники Массачусетського технологічного інституту розробляють метод конформної класифікації для підвищення точності ідентифікації хвороб, представляючи результати на великій конференції.

ДІЗНАТИСЯ БІЛЬШЕ

Квітень 16, 2025

Легка інвентаризація активів за допомогою комп'ютерного зору

Використовуючи генеративний ШІ та великі мовні моделі, постачальники електроенергії можуть оптимізувати управління інвентаризацією активів, автоматично витягуючи дані з етикеток за допомогою комп'ютерного зору. Це інноваційне рішення використовує сервіси AWS, такі як Amazon Bedrock і Claude 3 від Anthropic, щоб спростити процес, дозволяючи технічним фахівцям на місцях легко оновлювати бази дан...

ДІЗНАТИСЯ БІЛЬШЕ

Березень 25, 2025

Оптимізація агентних робочих процесів за допомогою мікросервісів NVIDIA NIM

Генеративний ШІ вдосконалює ПК за допомогою мікросервісів NVIDIA NIM, AI Blueprints і Project G-Assist для підвищення доступності та продуктивності. NVIDIA NIM пропонує готові моделі ШІ, оптимізовані для RTX, спрощуючи розробку ШІ та розширюючи інструментарій для ПК на основі ШІ.

ДІЗНАТИСЯ БІЛЬШЕ

Березень 13, 2025

Революція в оцінці аеродромів

Рендалл Пітерсен, науковий співробітник MathWorks в Массачусетському технологічному інституті та інженер ВПС США, має на меті розробити безпілотні системи для дистанційної оцінки аеродромів, зосереджуючись на виявленні боєприпасів, що не вибухнули, за допомогою гіперспектральної візуалізації. Його міждисциплінарний підхід та екстремальний спортивний досвід сприяють передовим дослідженням в Мас...

ДІЗНАТИСЯ БІЛЬШЕ

Березень 11, 2025

Інновації в рецептурі: Трансформуємо залишки їжі за допомогою штучного інтелекту Amazon

FoodSavr, рішення, що використовує генеративний ШІ на AWS, рекомендує рецепти на основі вмісту холодильника та продуктів, термін придатності яких закінчується в місцевих магазинах, зменшуючи харчові відходи та заощаджуючи гроші. Використовуючи Amazon Rekognition та Amazon Bedrock, користувачі можуть завантажувати зображення холодильника, щоб отримувати персоналізовані рецепти та пропозиції най...

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 28, 2025

ViT проти CNN: Майбутнє розпізнавання зображень

Трансформери революціонізують НЛП завдяки ефективним механізмам самоуваги. Інтеграція трансформаторів у комп'ютерний зір стикається з проблемами масштабування, але багатообіцяючі прориви вже на горизонті.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 14, 2025

Опановуємо просунуте машинне навчання

Такі досягнення в науці про дані, як Transformer, ChatGPT та RAG, змінюють технології. Розуміння еволюції НЛП є ключовим для науковців-початківців.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 11, 2025

Відкрийте для себе можливості Meta SAM 2.1 у Amazon SageMaker JumpStart!

Meta SAM 2.1, передова модель сегментації зору, тепер доступна на Amazon SageMaker JumpStart для різних галузей. Ця модель пропонує найсучасніші можливості виявлення та сегментації об'єктів з підвищеною точністю та масштабованістю, що дозволяє організаціям ефективно досягати точних результатів.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 7, 2025

Будуємо мости: Створення спільної мови

Каймінг Хе з Массачусетського технологічного інституту бачить, як ШІ руйнує стіни між науковими дисциплінами, створюючи спільну мову для прогресу та співпраці. Від AlphaFold до ChatGPT, інструменти ШІ сприяють прогресу в різних галузях, таких як прогнозування структури білків та обробка природної мови.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 6, 2025

Покращення управління популяцією лосося шляхом ефективного збору даних

Сара Бірі застосовує комп'ютерний зір і машинне навчання для моніторингу міграції лосося, критично важливої для здоров'я екосистеми і культурного значення на північному заході Тихого океану. Точний підрахунок лосося необхідний для управління рибальством на тлі загроз, пов'язаних з діяльністю людини, втратою середовища існування та зміною клімату.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 3, 2025

Захоплюючі дисплеї

Досягнення штучного інтелекту об'єднали НЛП і комп'ютерний зір, що призвело до появи моделей підписів до зображень, подібних до тієї, що використовується в «Покажи і розкажи». Ця модель поєднує CNN для обробки зображень і RNN для генерації тексту, використовуючи GoogLeNet і LSTM.

ДІЗНАТИСЯ БІЛЬШЕ

Січень 27, 2025

Виявлення даних про транспортний засіб із зображень

Створіть систему документації транспортних засобів, використовуючи GPT-4, LangChain і Pydantic від OpenAI для вилучення структурованих даних із зображень. Спростіть складні робочі процеси за допомогою LangChain і забезпечте узгодженість вихідних даних за допомогою Pydantic для легкого подальшого використання.

ДІЗНАТИСЯ БІЛЬШЕ

Січень 21, 2025

Опануйте прогнозування роздрібної торгівлі за допомогою Amazon SageMaker Canvas

Прогнозування ланцюгів поставок має вирішальне значення для бізнесу, який стикається з нестабільними ринками. SageMaker Canvas від Amazon Web Services пропонує безкодові ML-рішення для точного прогнозування в роздрібній торгівлі та виробництві споживчих товарів.

ДІЗНАТИСЯ БІЛЬШЕ

Січень 9, 2025

Людиноподібне спілкування: Навчання ШІ мистецтву мовлення

Дослідники MIT CSAIL створили систему штучного інтелекту, яка імітує людські голосові звуки без навчання, натхненну когнітивною наукою. Цей прорив може призвести до створення більш інтуїтивно зрозумілих інтерфейсів звукового дизайну, реалістичних ШІ-персонажів та інноваційних методів вивчення мов.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 20, 2024

Виявлення сліпих зон: Екологи викрили недоліки пошуку зображень дикої природи

Набори даних зображень природи мають величезний потенціал для екологів, але системи штучного інтелекту, які називаються моделями мови мультимодального зору, можуть підвищити ефективність пошуку зображень. Дослідники з Массачусетського технологічного інституту виявили, що великі ММЗ відмінно справляються з простими запитами, але не можуть впоратися з підказками експертного рівня, що вказує на п...

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 15, 2024

Вчені Массачусетського технологічного інституту обрані стипендіатами AI2050

Викладачі та випускники Массачусетського технологічного інституту назвали 2024 стипендіатів AI2050 від Schmidt Futures для вирішення складних проблем ШІ. Девід Автор і Сара Бірі серед нагороджених за інноваційні дослідницькі проекти в галузі ШІ.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 12, 2024

Освоєння CV VideoPlayer

CV VideoPlayer, пакет Python для дослідження комп'ютерного зору, спрощує візуалізацію відео та налагодження завдяки інтерактивним функціям. Він дозволяє легко налаштовувати накладання та редагування кадрів, покращуючи процес розробки для фахівців-практиків.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 10, 2024

Представляємо Pixtral 12B на Amazon SageMaker JumpStart

Pixtral 12B, найсучасніша модель мови технічного зору Mistral AI, чудово справляється з текстовими та мультимодальними завданнями, перевершуючи інші моделі. Вона має нову архітектуру з 400-мільйонним візуальним кодером і 12-мільярдним трансформаторним декодером, що забезпечує високу продуктивність і швидкість для розуміння зображень і документів.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 5, 2024

Економіка штучного інтелекту: ближчий погляд

Нобелівський лауреат з економіки Дарон Ачемоглу досліджує вплив ШІ на економічне зростання і продуктивність, оцінюючи скромне збільшення ВВП від 1,1 до 1,6 відсотка протягом наступного десятиліття. Дослідження показує, що близько 20-23% робочих завдань у США можуть бути автоматизовані за допомогою ШІ, а потенційна економія витрат становитиме 27%.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 5, 2024

Інтерактивні розмови з зображеннями з мультимодальними магістрами

Навчіться спілкуватися з зображеннями за допомогою Llama 3.2-Vision, найсучаснішої мультимодальної LLM від Meta. Вивчіть її можливості розпізнавання тексту та міркувань на ноутбуці Colab для локального виконання.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 3, 2024

Підтримка продажів за допомогою штучного інтелекту від Syngenta з агентами Amazon Bedrock

Syngenta та AWS співпрацювали над розробкою Cropwise AI на базі Amazon Bedrock Agents, щоб спростити вибір насіння для фермерів та торгових представників. Генеративний ШІ трансформує процес прийняття рішень, пропонуючи персоналізовані рекомендації в масштабі для більш ефективного та точного процесу селекції.

ДІЗНАТИСЯ БІЛЬШЕ

Листопад 29, 2024

Розкриття потенціалу мультимодальних вбудовувань

Мультимодальні вбудовування об'єднують текстові та графічні дані в єдину модель, уможливлюючи крос-модальні додатки, такі як підписи до зображень і модерація контенту. CLIP вирівнює представлення тексту і зображень для класифікації зображень з нульового кадру, демонструючи переваги спільного простору для вбудовування.

ДІЗНАТИСЯ БІЛЬШЕ

Листопад 25, 2024

Ефективне розгортання моделей Meta Llama 3.1 з AWS Inferentia та Trainium

Meta Llama 3.1 LLM з підтримкою 8B та 70B виводів тепер на екземплярах AWS Trainium та Inferentia. SageMaker JumpStart пропонує безпечне розгортання попередньо навчених моделей для кастомізації та тонкого налаштування.

ДІЗНАТИСЯ БІЛЬШЕ

Листопад 14, 2024

Оптимізація автоматичної обробки пошкоджень за допомогою Amazon Bedrock

Рішення з використанням генеративного штучного інтелекту AWS, такого як Amazon Bedrock і OpenSearch, спрощує оцінку пошкоджень транспортних засобів для страховиків, ремонтних майстерень і менеджерів автопарків. Перетворюючи зображення і метадані в числові вектори, цей підхід спрощує процес і надає цінну інформацію для прийняття обґрунтованих рішень в автомобільній промисловості.

ДІЗНАТИСЯ БІЛЬШЕ

Листопад 6, 2024

Використання можливостей HOG у комп'ютерному зорі

Гістограма орієнтованих градієнтів (HOG) - це ключовий алгоритм виділення ознак для задач виявлення та розпізнавання об'єктів, що використовує величину та орієнтацію градієнта для створення значущих гістограм. Алгоритм HOG передбачає обчислення градієнтних зображень, створення гістограм градієнтів і нормалізацію для зменшення варіацій освітлення.

ДІЗНАТИСЯ БІЛЬШЕ

Жовтень 28, 2024

Моніторинг моделей у реальному часі за допомогою Amazon SageMaker

Індивідуальний моніторинг моделей за допомогою Amazon SageMaker має вирішальне значення для сценаріїв ШІ/МЛ у реальному часі. SageMaker Model Monitor пропонує розширені можливості для моніторингу якості моделей та обробки багатокористувацьких запитів, прискорюючи розробку індивідуального моніторингу моделей.

ДІЗНАТИСЯ БІЛЬШЕ

Жовтень 22, 2024

Революційний ML: реляційне глибоке навчання

Беріть участь у реляційному глибокому навчанні (RDL), безпосередньо навчаючись на реляційній базі даних, перетворюючи таблиці на графік для ефективного виконання завдань ML. RDL усуває етапи функціональної інженерії, навчаючись на необроблених реляційних даних, підвищуючи продуктивність та деталізацію моделі.

ДІЗНАТИСЯ БІЛЬШЕ

Жовтень 16, 2024

Підвищення візуального інтелекту: Прогнозування наступних кадрів і поширення відео

Дослідники з Массачусетського технологічного інституту пропонують Diffusion Forcing - нову методику навчання, яка поєднує моделі дифузії наступного елемента та повної послідовності для гнучкої та надійної генерації послідовностей. Цей метод покращує прийняття рішень штучним інтелектом, підвищує якість відео та допомагає роботам у виконанні завдань, передбачаючи майбутні кроки з різним рівнем ш...

ДІЗНАТИСЯ БІЛЬШЕ

Жовтень 14, 2024

Революція в завданнях візуалізації з Florence-2

Florence-2 від Microsoft, компактна модель мови технічного зору, чудово справляється із завданнями анотування зображень з нульовим знімком. Попередньо навчена на FLD-5B, вона підтримує такі завдання, як створення підписів, виявлення об'єктів, сегментація та розпізнавання тексту в одній моделі.

ДІЗНАТИСЯ БІЛЬШЕ

Жовтень 11, 2024

Розвінчання хайпу про штучний інтелект

Такі моделі ШІ, як ChatGPT, є повсюдними та корисними, але генеративний ШІ створює проблеми з дезінформацією та етичними проблемами. Ажіотаж навколо штучного інтелекту, прикладом якого є різке зростання акцій NVIDIA, викликає питання щодо його впливу на суспільство та потенційних ризиків.

ДІЗНАТИСЯ БІЛЬШЕ

Жовтень 3, 2024

Революція в галузі сталого розвитку за допомогою ШІ з відкритим вихідним кодом

Meta - це відкритий доступ до даних для створення карт населення на основі штучного інтелекту, які допоможуть у проектах з адаптації до зміни клімату та реагування на катастрофи в усьому світі. Точні карти населення мають вирішальне значення для сталого розвитку енергетики, готовності до катастроф та адаптації до зміни клімату в усьому світі.

ДІЗНАТИСЯ БІЛЬШЕ

Жовтень 2, 2024

Освоєння YOLOv8: навчання користувацьких моделей з легкістю

Навчати моделі комп'ютерного зору за допомогою YOLOv8 від Ultralytics тепер простіше за допомогою Python, CLI або Google Colab. YOLOv8 відомий своєю точністю, швидкістю та гнучкістю, пропонуючи локальні або хмарні варіанти навчання, такі як Google Colab для підвищення обчислювальної потужності.

ДІЗНАТИСЯ БІЛЬШЕ

Вересень 30, 2024

Машинний зір: Знаходити обличчя всюди

У 1994 році Діана Дуйзер продала на аукціоні смажений сир із зображенням Діви Марії за $28 000. Дослідження парейдолії, проведене в Массачусетському технологічному інституті, виявляє відмінності у сприйнятті між людиною і машиною та можливий еволюційний зв'язок з інстинктом виживання.

ДІЗНАТИСЯ БІЛЬШЕ

Вересень 30, 2024

Виявлення об'єктів: Покращення фокусування робота

Інженери Массачусетського технологічного інституту розробили метод Clio, який дозволяє роботам приймати інтуїтивні, релевантні завданням рішення, визначаючи і запам'ятовуючи лише релевантні елементи сцени. На думку дослідників, можливості Clio, продемонстровані в реальних експериментах, можуть мати вирішальне значення для пошуково-рятувальних місій, домашніх роботів і автоматизації виробництва.

ДІЗНАТИСЯ БІЛЬШЕ

Вересень 27, 2024

Автоматизація перевірок безпеки за допомогою комп'ютерного зору на AWS

Компанія Northpower, великий інфраструктурний підрядник у Новій Зеландії, використовує штучний інтелект для визначення пріоритетності ризиків для громадської безпеки, зменшуючи зусилля та викиди вуглецю. Зіткнувшись з проблемами при перевірці електроопор на безпеку, Northpower поєднує цифрові та відскановані дані, щоб ефективно виявляти та усувати потенційні небезпеки.

ДІЗНАТИСЯ БІЛЬШЕ

Вересень 22, 2024

Майбутнє гуманоїдів у наших домівках

Tesla та інші компанії стикаються з проблемами при оснащенні роботів штучним інтелектом. Робот Atlas від Boston Dynamics дає надію на створення багатоцільового домашнього дроїда.

ДІЗНАТИСЯ БІЛЬШЕ

Вересень 12, 2024

Увімкнись: Азбука трансформації

Meta та Waymo представляють модель Transfusion, що поєднує трансформатор та дифузію для мультимодального прогнозування. Модель Transfusion використовує двонаправлену увагу трансформатора для маркерів зображень та завдання для попереднього навчання для тексту та зображень.

ДІЗНАТИСЯ БІЛЬШЕ

Серпень 19, 2024

Nimble Reranking: Amazon SageMaker JumpStart Unleashed

Cohere Rerank 3 Nimble FM покращує корпоративні пошукові системи, підвищуючи швидкість і точність шляхом ефективного переупорядкування релевантних документів. Amazon SageMaker JumpStart надає доступ до попередньо навчених моделей, таких як Cohere Rerank 3 Nimble, що дозволяє налаштовувати їх для конкретних випадків використання без необхідності починати з нуля.

ДІЗНАТИСЯ БІЛЬШЕ

Серпень 7, 2024

Підвищення ефективності трансформатора зору за допомогою BatchNorm

Інтеграція пакетної нормалізації в архітектуру ViT скорочує час навчання та виведення більш ніж на 60%, зберігаючи або покращуючи точність. Модифікація передбачає заміну нормалізації шарів на пакетну нормалізацію в архітектурі трансформатора, що використовує лише кодер.

ДІЗНАТИСЯ БІЛЬШЕ

Серпень 7, 2024

Опановуємо інтерв'ю з машинним навчанням

Розшифровка посадових ролей у сфері ВК є ключем до успіху співбесіди. Розуміння спектру ролей може вдосконалити стратегію та підвищити впевненість у собі.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 31, 2024

Революція в домашній робототехніці завдяки навчанню Real-to-Sim

Дослідники MIT CSAIL розробили RialTo - систему, яка створює цифрових двійників для швидшого та ефективнішого навчання роботів у певних умовах. RialTo покращила продуктивність роботів на 67% при виконанні різних завдань, легко справляючись з перешкодами та відволікаючими факторами.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 29, 2024

Революція в цифровому середовищі з мікросервісами NVIDIA NIM

NVIDIA представила на SIGGRAPH досягнення в галузі генеративного фізичного ШІ, включаючи мікросервіси NIM для створення інтерактивних візуальних агентів ШІ та навчання фізичних машин. Ця технологія трансформує такі галузі, як виробництво та охорона здоров'я, дозволяючи роботам та автоматизованим системам ефективніше орієнтуватися в навколишньому середовищі.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 29, 2024

Оптимізуйте прогнозування за допомогою SageMaker Canvas

Amazon Forecast, запущений у 2019 році, тепер переводить користувачів на Amazon SageMaker Canvas для швидшого та економічно ефективнішого прогнозування часових рядів з підвищеною прозорістю та можливостями побудови моделей. SageMaker Canvas дозволяє на 50% швидше будувати моделі та на 45% швидше робити прогнози, а також забезпечує чудову прозорість моделей і можливість навчати ансамбль моделей...

ДІЗНАТИСЯ БІЛЬШЕ

Липень 24, 2024

Представляємо моделі Llama 3.1 на Amazon SageMaker JumpStart

Багатомовні LLM Llama 3.1, доступні на Amazon SageMaker JumpStart, пропонують оптимізовані моделі генеративного ШІ для розробників і бізнесу. SageMaker JumpStart надає доступ до попередньо навчених базових моделей, що дозволяє налаштовувати та безпечно розгортати їх у спеціальному середовищі VPC.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 17, 2024

Виявлення хмар за допомогою штучного інтелекту

Супутникові знімки покращують моніторинг змін на Землі, але сегментація хмар має вирішальне значення. Для видалення хмар на знімках Sentinel-2 порівнюються такі алгоритми, як Random Forest та YOLO. Доступ до даних через Центр відкритого доступу Copernicus, Google Earth Engine або Python-пакет sentinelhub.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 12, 2024

Розкриття таємниць часових рядів для магістрів права

Фундаментальні моделі, такі як великі мовні моделі (LLM), адаптуються для моделювання часових рядів за допомогою великих фундаментальних моделей часових рядів (LTSM). Використовуючи подібність послідовних даних, LTSM має на меті навчатися на різноманітних даних часових рядів для таких завдань, як виявлення та класифікація викидів, спираючись на успіх LLM в обчислювальній лінгвістиці.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 11, 2024

Передові інновації в галузі комп'ютерного зору

TDS святкує цю подію цікавими статтями про передові технології комп'ютерного зору та розпізнавання об'єктів. Серед основних моментів - підрахунок об'єктів на відео, відстеження гравців зі штучним інтелектом у хокеї та експрес-курс з планування автономного водіння.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 9, 2024

Покращення розуміння музики за допомогою згортки графіків на основі сприйняття

MusGConv представляє блок згортки графів, натхненний сприйняттям, для обробки даних нотної партитури, підвищуючи ефективність і продуктивність в задачах розуміння музики. Традиційні підходи MIR розширюються за допомогою MusGConv, який моделює музичні партитури у вигляді графів для відображення складних, багатовимірних музичних взаємозв'язків.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 2, 2024

Supercharge PyTorch Inference на AWS Graviton

PyTorch 2.0 представив torch.compile для швидшого виконання коду. AWS оптимізувала torch.compile для процесорів Graviton3, що призвело до значного покращення продуктивності для NLP, CV та рекомендаційних моделей.

ДІЗНАТИСЯ БІЛЬШЕ

Липень 1, 2024

Еволюція класифікації зображень: Подорож через згорткові нейронні мережі

Прорив Яна Лекуна 1989 року з використанням згорткових нейронних мереж зберіг дані просторових зображень, зробивши революцію в дослідженнях комп'ютерного зору. CNN використовують фільтри для вилучення карт об'єктів, накладання шарів для створення потужних класифікаторів зображень.

ДІЗНАТИСЯ БІЛЬШЕ

Червень 29, 2024

Революція в ШІ: трансформатори зору в автокодери з масками

Трансформатори, відомі своєю революцією в НЛП, тепер чудово справляються із завданнями комп'ютерного зору. Дослідіть архітектури Vision Transformer та Masked Autoencoder Vision Transformer, які уможливили цей прорив.

ДІЗНАТИСЯ БІЛЬШЕ

Червень 18, 2024

Тіньове моделювання відкриває приховані об'єкти в 3D-сценах

Дослідники з Массачусетського технологічного інституту та Мета розробляють PlatoNeRF - техніку комп'ютерного зору, що використовує тіні та машинне навчання для створення точних 3D-моделей сцен, покращуючи ефективність автономних транспортних засобів та AR/VR. Поєднуючи лідар та штучний інтелект, PlatoNeRF пропонує нові можливості для реконструкцій і буде представлений на конференції з комп'юте...

ДІЗНАТИСЯ БІЛЬШЕ

Червень 18, 2024

Розгадка візуального інтелекту мовних моделей

Дослідники з Массачусетського технологічного інституту виявили, що великі мовні моделі можуть розуміти візуальний світ і генерувати складні сцени. Запропонувавши LLM самокорегувати код для зображень, вони покращили прості малюнки та навчили систему технічного зору без використання візуальних даних.

ДІЗНАТИСЯ БІЛЬШЕ

Червень 11, 2024

Підвищення ефективності ML за допомогою Sprinklr на AWS Graviton3

Sprinklr використовує ШІ для покращення клієнтського досвіду, досягнувши 20% підвищення продуктивності за допомогою AWS Graviton3 для економічно ефективного ML-висновку. Тисячі серверів налаштовують і обслуговують понад 750 моделей ШІ по 60+ вертикалях, обробляючи 10 мільярдів прогнозів щодня.

ДІЗНАТИСЯ БІЛЬШЕ

Червень 11, 2024

Революційний скринінг електронних матеріалів за допомогою нового методу комп'ютерного зору

Вчені використовують штучний інтелект для визначення передових матеріалів для сонячних батарей. Інженери Массачусетського технологічного інституту розробляють техніку комп'ютерного зору, яка прискорює визначення характеристик матеріалів у 85 разів, з метою повністю автоматизованого скринінгу матеріалів.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 31, 2024

Дивергентні застосування ШІ

Вибір правильного сценарію використання ШІ має вирішальне значення для успіху. ШІ може бути цінним навіть при помірній продуктивності, пропонуючи унікальні рішення. Приклади включають злиття сенсорів і генеративний ШІ в повсякденних продуктах.

ДІЗНАТИСЯ БІЛЬШЕ

Травень 28, 2024

Пошук відеодій на основі штучного інтелекту

Вчені з Массачусетського технологічного інституту та лабораторії штучного інтелекту MIT-IBM Watson AI Lab розробили новий підхід до навчання комп'ютерів визначати дії на відео, використовуючи лише транскрипт. Цей метод, який називається просторово-часовим заземленням, підвищує точність ідентифікації дій у довгих відео і може знайти застосування в онлайн-навчанні та охороні здоров'я.

ДІЗНАТИСЯ БІЛЬШЕ

Квітень 14, 2024

Опановуємо виявлення аномалій за допомогою узагальнених моделей

Відкрийте для себе новаторські дослідження компанії XYZ щодо розробки нової технології штучного інтелекту, яка може зробити революцію в галузі охорони здоров'я. Дізнайтеся, як ця інновація покращить догляд за пацієнтами та точність діагностики.

ДІЗНАТИСЯ БІЛЬШЕ

Квітень 11, 2024

Невизначеність штучного інтелекту: Прорив у медичній візуалізації

Нове дослідження розкриває революційну технологію штучного інтелекту, розроблену компанією Google, яка революціонізує аналіз даних у сфері охорони здоров'я. Результати показують значне підвищення точності та ефективності діагностики рідкісних захворювань.

ДІЗНАТИСЯ БІЛЬШЕ

Квітень 5, 2024

Покращення модерації контенту за допомогою Amazon Rekognition

Дізнайтеся про новаторську співпрацю між Tesla та SpaceX, яка зробила революцію в електромобілях та космічних подорожах. Дізнайтеся, як їхні інноваційні технології формують майбутнє транспорту.

ДІЗНАТИСЯ БІЛЬШЕ

Квітень 4, 2024

Nielsen Sports скорочує витрати на відеоаналіз за допомогою Amazon SageMaker

Дізнайтеся, як нова технологія безпілотного водіння Tesla революціонізує автомобільну індустрію. Завдяки вдосконаленим алгоритмам штучного інтелекту та найсучаснішим датчикам Tesla прокладає шлях до автономних транспортних засобів.

ДІЗНАТИСЯ БІЛЬШЕ

Березень 28, 2024

NVIDIA Hopper домінує над генеративним ШІ на MLPerf

Дізнайтеся, як інноваційні стартапи революціонізують технологічну індустрію, створюючи передові продукти. Від рішень на основі штучного інтелекту до стійких технологій - ці компанії змінюють майбутнє.

ДІЗНАТИСЯ БІЛЬШЕ

Березень 25, 2024

Навчання ШІ для виявлення таборів для бездомних у Каліфорнії

Дізнайтеся про новаторську співпрацю між Tesla та SpaceX у розробці інноваційних рішень у сфері відновлюваної енергетики. Дізнайтеся, як бачення Ілона Маска революціонізує майбутнє транспорту та освоєння космосу.

ДІЗНАТИСЯ БІЛЬШЕ

Березень 18, 2024

Революція в комп'ютерному зорі з FeatUp

Дослідники з Массачусетського технологічного інституту розробили систему FeatUp, яка покращує алгоритми комп'ютерного зору для одночасного захоплення деталей високого та низького рівня, революціонізуючи обробку зображень. FeatUp збільшує роздільну здатність у 16-32 рази, покращуючи такі завдання, як виявлення об'єктів та оцінка глибини, пропонуючи новий рівень чіткості в моделях штучного інтел...

ДІЗНАТИСЯ БІЛЬШЕ

Березень 14, 2024

Освоїти 3D-гаусове розбризкування: Від представлення сцени до рендерингу зображень

3D гаусівське розбризкування, новий метод синтезу нового вигляду, кидає виклик NeRF як домінуючій техніці представлення 3D-сцен. Цей метод використовує анізотропні гаусиани для відтворення чітких 3D-моделей у реальному часі, забезпечуючи унікальний підхід до представлення сцени та рендерингу зображень.

ДІЗНАТИСЯ БІЛЬШЕ

Березень 8, 2024

Розблокування 3D-розуміння з 2D-зображень за допомогою Sun RGB-D

Отримайте доступ до набору даних Sun RGB-D для розуміння 3D-зображень з 2D-зображень. Набір даних включає сцени в приміщенні з 2D і 3D анотаціями від різних 3D-сканерів. Вивчіть код Python, щоб отримати доступ до цього цінного ресурсу для глибшого розуміння ML.

ДІЗНАТИСЯ БІЛЬШЕ

Березень 8, 2024

Революція в комп'ютерному зорі: Навігація по ландшафту штучного інтелекту

Останні досягнення в галузі штучного інтелекту, включаючи GenAI та LLM, революціонізують галузі завдяки підвищенню продуктивності та можливостей. Архітектури трансформаторів зору, такі як ViTs, змінюють комп'ютерний зір, пропонуючи чудову продуктивність і масштабованість порівняно з традиційними CNN.

ДІЗНАТИСЯ БІЛЬШЕ

Березень 7, 2024

Покращення периферійного зору ШІ

Дослідники Массачусетського технологічного інституту розробили набір даних для імітації периферійного зору в моделях штучного інтелекту, що покращує розпізнавання об'єктів. Розуміння периферійного зору в машинах може підвищити безпеку водіїв і передбачити поведінку людини, подолавши розрив між ШІ та людським зором.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 23, 2024

Розгортання ML: Від моделі до хмари на Python

У статті висвітлено розгортання ML-моделей у хмарі, об'єднання полів CS і DS та подолання обмежень пам'яті при розгортанні моделей. Ключові технології включають Detectron2, Django, Docker, Celery, Heroku та AWS S3.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 14, 2024

Оптимізація маркування анотацій поз за допомогою Amazon SageMaker Basic Truth

У цій статті обговорюється важливість високоякісних даних і зменшення помилок маркування в моделях оцінки пози. Вона демонструє, як спеціальний робочий процес маркування в Amazon SageMaker Ground Truth може впорядкувати процес маркування і мінімізувати помилки, що в кінцевому підсумку зменшує витрати на отримання точних міток поз.

ДІЗНАТИСЯ БІЛЬШЕ

Лютий 7, 2024

Автоматизація виявлення шахрайства з іпотечними документами за допомогою детектора шахрайства ML та Amazon

Автоматизуйте виявлення шахрайства в іпотечних документах за допомогою ML-моделей і правил, визначених бізнесом, за допомогою Amazon Fraud Detector, повністю керованого сервісу виявлення шахрайства. Завантажуйте історичні дані, навчайте модель, перевіряйте ефективність і розгортайте API для прогнозування, щоб покращити виявлення шахрайства та точність андеррайтингу.

ДІЗНАТИСЯ БІЛЬШЕ

Січень 31, 2024

Виявлення підробки зображень у масштабі: Побудова моделі комп'ютерного зору на Amazon SageMaker

Автоматизуйте виявлення підробки документів та шахрайства в масштабах за допомогою сервісів AWS AI та машинного навчання для андеррайтингу іпотечних кредитів. Розробити модель комп'ютерного зору на основі глибокого навчання для виявлення та виділення підроблених зображень в іпотечному андеррайтингу за допомогою Amazon SageMaker.

ДІЗНАТИСЯ БІЛЬШЕ

Січень 31, 2024

Перетворення зображень їжі на рецепти: Сила штучного інтелекту та вогню

Технологія штучного інтелекту здатна перетворювати зображення їжі на рецепти, що дозволяє надавати персоналізовані рекомендації щодо їжі, адаптувати їх до культурних особливостей та автоматизувати процес приготування. Цей інноваційний метод поєднує комп'ютерний зір і обробку природної мови для створення вичерпних рецептів на основі зображень їжі, долаючи розрив між візуальними зображеннями стр...

ДІЗНАТИСЯ БІЛЬШЕ

Січень 28, 2024

Розблокування ефективності роботів: Мультимодальні моделі ШІ революціонізують комплексне планування

Лабораторія неймовірного штучного інтелекту Массачусетського технологічного інституту розробила мультимодальний фреймворк під назвою HiP, який використовує три різні базові моделі, щоб допомогти роботам створювати детальні плани для виконання складних завдань. На відміну від інших моделей, HiP не потребує доступу до даних парного зору, мови та дій, що робить її більш економічно ефективною та п...

ДІЗНАТИСЯ БІЛЬШЕ

Січень 25, 2024

Оволодіння монокулярною оцінкою глибини: Техніка та оцінка

У цій статті досліджується монокулярна оцінка глибини (MDE) та її важливість для додатків комп'ютерного зору. Вона містить покрокову інструкцію із завантаження та візуалізації даних карти глибини, запуску виведення за допомогою Marigold і DPT, а також оцінювання прогнозів глибини за допомогою набору даних SUN RGB-D.

ДІЗНАТИСЯ БІЛЬШЕ

Січень 19, 2024

Об'єднання сприйняття, планування та контролю: Майбутнє автономної робототехніки

У статті досліджується використання легких ієрархічних трансформаторів зору в автономній робототехніці, підкреслюється ефективність концепції спільної магістралі для багатозадачного навчання. У ній також обговорюється поява великих мультимодальних моделей та їхній потенціал у створенні уніфікованої архітектури для наскрізних рішень автономного водіння.

ДІЗНАТИСЯ БІЛЬШЕ

Січень 15, 2024

Панування ResNet: Нова ера з трансформаторами бачення

Комп'ютерний зір еволюціонував від маленьких піксельних зображень до створення зображень високої роздільної здатності на основі описів, причому менші моделі покращують продуктивність у таких сферах, як фотографування смартфонів та автономні транспортні засоби. Модель ResNet домінує в комп'ютерному зорі вже майже вісім років, але з'являються нові розробки, такі як Vision Transformer (ViT), що д...

ДІЗНАТИСЯ БІЛЬШЕ

Січень 11, 2024

Революція в гольфі: хмарне відстеження м'яча виводить PGA TOUR на нові висоти

PGA TOUR розробляє систему відстеження положення м'яча наступного покоління, яка використовує комп'ютерний зір і методи машинного навчання для визначення місцезнаходження м'ячів для гольфу на паттінг-гріні. Система, розроблена Інноваційним центром Amazon Generative AI, успішно відстежує положення м'яча та прогнозує координати його спокою.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 30, 2023

Революція в музичному штучному інтелекті: 3 прориви, на які варто очікувати в 2024 році

2024 рік може стати переломним для музичного ШІ завдяки проривам у перетворенні тексту на музику, музичному пошуку та чат-ботам. Однак ця сфера все ще відстає від мовленнєвого ШІ, і для того, щоб революціонізувати музичну взаємодію за допомогою ШІ, необхідний прогрес у гнучкому і природному розділенні джерел.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 23, 2023

Сила гауссового розбризкування: Революційна зміна 3D-зображень

Гаусове розбризкування - це швидкий і зрозумілий метод представлення 3D-сцен без нейронних мереж, що набуває популярності у світі, одержимому моделями штучного інтелекту. Він використовує 3D-точки з унікальними параметрами для точної відповідності рендерингу відомим зображенням з набору даних, пропонуючи свіжу альтернативу складним і непрозорим методам, таким як NeRF.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 20, 2023

Революційні роботи: Досягнення в автономних технологіях 2023 року

Автономні машини в робототехніці продемонстрували свої можливості в 2023 році, серед яких варто відзначити розумну коляску зі штучним інтелектом від Glüxkind, систему mGripAI для пакування харчових продуктів від Soft Robotics і робота TM25S від Quanta для інспекції продукції, в усіх з яких використовуються технології NVIDIA.

ДІЗНАТИСЯ БІЛЬШЕ

Грудень 14, 2023

Революція в моніторингу гірничодобувного обладнання за допомогою прототипування AWS і комп'ютерного зору

ICL, міжнародна виробнича та гірничодобувна корпорація, розробила власні можливості з використанням машинного навчання та комп'ютерного зору для автоматичного моніторингу свого гірничодобувного обладнання. За підтримки програми AWS Prototyping вони змогли створити фреймворк на AWS за допомогою Amazon SageMaker для отримання зображень з 30 камер, з потенціалом масштабування до тисяч.

ДІЗНАТИСЯ БІЛЬШЕ