Новини

Свіжі новини та корисні статті про штучний інтелект і машинне навчання

Ставка на $1 млрд: світові моделі Лекуна vs LLM-імперії

Ян Лекун створив новий стартап AMI, прагнучи побудувати моделі ШІ, які здатні розуміти фізичний світ, мислити причинно-наслідковими зв’язками та розвинути справжній здоровий глузд. Цей підхід кидає виклик сучасній домінуючій парадигмі, припускаючи, що масштабування LLM може саме по собі бути недостатнім для досягнення рівня людського інтелекту.

Штучний нейрон наближає роботів до людського рівня свідомості

Учені створили транснейрон – штучний нейрон, який здатен імітувати активність відразу декількох ділянок людського мозку. Це досягнення може значно прискорити розвиток роботів із людським рівнем сприйняття, адаптивності та здатності до навчання.

Всередині мозку ШІ: пам'ять vs. міркування

Нові дослідження продемонстрували, що мовні моделі зберігають пам’ять і логіку в абсолютно окремих нейронних ланцюгах, тобто машини “думають” і “пам’ятають” по-різному. Це відкриття прокладає шлях до створення систем ШІ, які зможуть забувати конфіденційні дані, зберігаючи при цьому свій інтелект.

Mamba-3 – нова ера в мовному моделюванні

Модель простору станів Mamba-3 переосмислює те, як ШІ мислить, навчається та розуміє мову. З покращенням відстеження контексту, обробки інформації та генерації відповідей, Mamba-3 встановлює новий стандарт продуктивності та швидкості інференсу, що виходить за рамки традиційних моделей-трансформерів.

БПЛА опановують високоточні завдання в польоті

FlyingToolbox – це система дронів, здатних стикуватися та обмінюватися предметами у польоті, навіть в умовах турбулентності. Технологія дозволяє виконувати точні багатоетапні операції: від технічного обслуговування і будівельних робіт на висоті до місій з ліквідації наслідків надзвичайних ситуацій.

Прихована упередженість у мовних моделях

Вчені дослідили серйозний недолік мовних моделей – так зване позиційне упередження, коли моделі приділяють більше уваги інформації на початку та в кінці тексту, нехтуючи його серединою. Дослідження показало, що причина цього явища корениться не тільки у навчальних даних, а й у самій архітектурі моделей.

Phi-4 – малі моделі, великі результати

Сімейство Phi-4 від Microsoft – це нове покоління малих мовних моделей, які створені для вирішення складних завдань, таких як програмування, математика та планування, і які часто перевершують великі моделі. Вони наводять переконливі міркування, залишаючись при цьому ефективними для використання в середовищах з низькою затримкою.

Швидше, розумніше, реалістичніше – чим здивує Midjourney?

Midjourney випустила V7, свою найпотужнішу модель генерації зображень, яка вражає кращим розумінням текстових промптів та персоналізацією арту в реальному часі. Оновлена архітектура V7 забезпечує кращу узгодженість об'єктів і реалістичність текстур та впроваджує новий режим Draft для швидких ітерацій зображень.

Super-Turing AI: Імітація навчання людського мозку

Нова нейронна система, яка імітує процеси навчання мозку, відкриває шлях до швидшого і більш ефективного ШІ. Використовуючи принципи геббіанського навчання та пластичність, залежну від часу спайків, ця технологія може значно підвищити продуктивність ШІ, водночас зменшуючи екологічні та економічні витрати.

Від тексту до 3D: магія моделі Edify 3D від NVIDIA

Edify 3D від NVIDIA створює високоякісні 3D-моделі менш ніж за 2 хвилини за допомогою AI. Це ідеальне рішення для ігор, анімації та дизайну, яке поєднує дифузійні моделі та трансформери, забезпечуючи швидку, точну та масштабовану генерацію 3D-об'єктів з тексту чи зображень.

Microsoft запускає модель Phi-4 з повністю відкритими вагами

Microsoft випустила модель Phi-4 з відкритими вагами за ліцензією MIT, відкриваючи дослідникам та розробникам нові можливості у галузі ШІ. Завдяки 14 млрд параметрів Phi-4 перевершує аналоги у вирішенні математичних завдань та багатозадачності, забезпечуючи ефективну роботу при обмежених ресурсах.

Суперечлива наука: штучний інтелект і Нобелівські премії

Нобелівські премії 2024 року з фізики та хімії встановили прецедент для визнання внеску штучного інтелекту у науку. Хоча деякі вчені ставлять під сумнів відповідність ШІ традиційним дисциплінам, інші вважають це необхідним кроком для визнання міждисциплінарного характеру сучасних досліджень.

NeuPh: Прорив у високоточній реконструкції зображень за допомогою нейромереж

Нова нейронна мережа від Бостонського університету – Neural Phase Retrieval використовує методи глибокого навчання для поліпшення реконструкції зображень з високою роздільною здатністю з даних з низькою роздільною здатністю. Результати NeuPh вже успішно перевершили традиційні методи.

MAIA: автоматизований агент для інтерпретації моделей ШІ

Проводячи експерименти та покращуючи їх аналіз, MAIA може інтерпретувати нейронні мережі, що підвищує розуміння роботи ШІ моделей. Цей агент може визначати активність нейронів, видаляти нерелевантні функції та виявляти упередження, роблячи системи ШІ безпечнішими та більш прозорими.

Гонки дронів сприяють інноваціям ШІ для космічних досліджень

Перегони дронів стали використовувати для тестування нейронних мереж для майбутніх космічних місій. Цей проєкт спрямований на автономне керування складними маневрами космічного корабля, оптимізацію бортових операцій і підвищення ефективності та надійності місії.

Штучний інтелект навчився розуміти гавкіт собак

ШІ навчився розшифровувати собачий гавкіт, відрізняючи грайливий гавкіт від агресивного, а також визначати вік, стать і породу собаки. Спочатку навчені на людській мові, моделі ШІ досягли вражаючої точності і обіцяють значні покращення в комунікації та догляді за тваринами.

Метеорологічне диво: ШІ переосмислює прогнозування погоди

Подібно до приближення сильного холодного фронту, у спільноті синоптиків відбуваються серйозні зміни. Очікуваний результат? Абсолютно новий спосіб прогнозування погоди на основі ШІ, який працює на персональному комп’ютері.

Llama 3: останні досягнення серед великих мовних моделей

Остання розробка від компанії Meta AI – Llama 3 може похвалитися неперевершеною обробкою мовлення, що підвищує її здатність виконувати складні задачі. Завдяки збільшеному словниковому запасу та розширеним функціям безпеки підвищено продуктивність і універсальність моделі.

SORA: нові можливості ШІ для перетворення тексту у відео

Останнє творіння від OpenAI – Sora – створює захоплюючі відео, демонструючи неперевершену реалістичність візуальних композицій. Завдяки поєднанню обробки мови та генерації відео, модель може інтерпретувати текстові підказки, пристосовуватися до різних способів введення даних та імітувати динамічний рух камери.

BASE TTS: сила моделі з мільярдом параметрів для перетворення тексту на мову

Amazon представив модель TTS з інноваційною архітектурою, яка встановлює новий стандарт для синтезу мовлення. BASE TTS не тільки забезпечує неперевершену природність мовлення, але й демонструє надзвичайну адаптивність у обробці різноманітних мовних нюансів.

MPT-7B: нова велика мовна модель з відкритим вихідним кодом

MPT-7B пропонує оптимізацію архітектури та покращення продуктивності, включаючи сумісність з екосистемою HuggingFace. Навчена на 1 трильйоні токенів тексту та коду, модель встановлює новий стандарт LLM для комерційного використання.

Глибоке активне навчання – новий підхід до навчання моделей

Глибоке активне навчання поєднує традиційне навчання нейронної мережі зі стратегічним відбором зразків даних. Такий інноваційний підхід дозволяє підвищити продуктивність, ефективність і точність моделі в широкому спектрі застосувань.

Від соціальних мереж до макроекономіки: ALERTA-Net і майбутнє аналізу фондового ринку

ALERTA-Net — нова глибока нейронна мережа, що поєднує соціальні мережі, макроекономічні показники та інформацію пошукових систем. Унікальна модель передбачає рух цін на акції та волатильність фондового ринку, виходячи за межі традиційних методів аналізу.

Чи проходить GPT-4 тест Тюрінга?

У 1950 році британський вчений Алан Тюрінг запропонував тест, який визначає, чи здатні машини мислити. На сьогоднішній день, ще жодному штучному інтелекту не вдалося успішно його пройти. Чи буде ChatGPT першим?

Чи є глибоке навчання необхідним компонентом штучного інтелекту?

У продовження досліджень про деревоподібні архітектури вивчається питання про необхідність глибокого навчання для ШІ та пропонуються альтернативні методи машинного навчання, які можуть бути більш ефективними для складних завдань класифікації.

Підвищення рівня безпеки у небі: як штучний інтелект допомагає БПЛА

Науковці з Інституту гарантованої автономії досліджують нові методи забезпечення безпеки у світі безпілотних авіаційних систем, де зростає кількість БПЛА, застосовуючи сучасні методи штучного інтелекту та симуляційних середовищ.

Слідкуйте за кожним пікселем: оцінка руху з OmniMotion

Новий метод оцінки руху дозволяє отримувати довгострокові траєкторії руху для кожного пікселя в кадрі, навіть у разі швидких рухів та складних сцен. Дізнайтеся більше про захоплюючу технологію та майбутній аналіз руху в статті про OmniMotion.

Нейронна мережа імітує поведінку мурах для навігації роботів

Натхнені здібностями мурах, дослідники з Единбурзького та Шеффілдського університетів розробляють штучну нейронну мережу, щоб допомогти роботам розпізнавати та запам’ятовувати маршрути в складних природних умовах.

TalkToModel: інтерфейс для розуміння моделей машинного навчання

TalkToModel – інноваційна система для забезпечення відкритих діалогів із моделями МН. Ця платформа дозволяє користувачам не тільки розуміти, але й спілкуватися з моделями МН природною мовою, а також отримувати пояснення процесів їх роботи.

Майбутнє медичного обстеження: техніка відображення пози на основі МН

Нова методика використовує відеоаналіз для проведення клінічної оцінки моторної функції на основі конкретних шаблонів поз, що зменшує необхідність у частих особистих медоглядах та покращує догляд за пацієнтами.

SeamlessM4T від Meta: спілкування без мовних бар’єрів

SeamlessM4T руйнує мовні бар'єри завдяки своїм комплексним можливостям перекладу та транскрипції. Ця модель ШІ може легко перетворити мову або текст, забезпечуючи переклад у режимі реального часу та сприяючи міжкультурному взаєморозумінню.

Потужність гібридного комп’ютерного зору: поєднання фізики та big data

Нове дослідження по вдосконаленню технологій комп’ютерного зору поєднує науки про великі дані та фізику. Таке гібридне комп’ютерне бачення дозволяє ШІ усвідомленно сприймати, взаємодіяти та реагувати на зовнішнє середовище в реальному часі.

Застосування нейронних мереж тестують для повернення зразків ґрунту з поверхні Марса

Європейське космічне агентство використовує нейронні мережі при розробці системи збору та доставки зразків з Марса. Складна місія повернення зразків, зібраних марсоходом Perseverance, має критичне значення для розкриття таємниць червоної планети.

Нова архітектура, що поєднує в собі глибокі нейронні мережі та векторно-символьні моделі

Нова архітектура має на меті подолати існуючі обмеження нейронних мереж та символічного ШІ. Запропонована модель вже демонструє високу ефективність у вирішенні логічних завдань, відкриваючи перспективу для інтеграції різних парадигм ШІ.

Меміндуктор: дослідники відкрили новий елемент електронних схем

Меміндуктор, як і відкриті раніше мемрісторі та мемконденсатор, є одним із елементів електронної схеми, які можуть зберігати та відновлювати попередні значення струму або напруги.

Використання машинного навчання для пошуку надійних та доступних сонячних елементів

Сонячні батареї на основі гібридних органо-неорганічних перовскітів є наразі напрямом альтернативної енергетики, який найактивніше розвивається. Ці молекули започаткували розвиток нового класу фотовольтаїчних пристроїв – перовскітних сонячних елементів.

Новий метод для підвищення точності комп'ютерного зору

Дослідники використали набір простих програм для генерації зображень, щоб створити набір даних та навчити модель комп'ютерного зору. Такий підхід сприяє покращенню продуктивності моделей класифікації зображень, навчених на синтетичних даних.

Як нейронні мережі навчаються руху? Інтерпретація моделювання руху з використанням відносної зміни положення

Вчені розробили новий підхід до моделювання руху, використовуючи відносну зміну положення. Вони оцінили здатність архітектур глибинних нейронних мереж моделювати рух за допомогою задач розпізнавання та прогнозування руху.

Ембедінг стохастичного кластера – новий метод візуалізації великих наборів даних

Дослідники розробили новий алгоритм ШІ, спрямований на візуалізацію кластерів даних та інших макроскопічних ознак так, щоб вони були максимально чіткими, легкими для спостереження та зрозумілими людині.

Deep neural network - нейронна мережа на основі кремнієвих мемристивних синапсів

Дослідники створили нову нейроморфну обчислювальну систему, що підтримує генеративний та графічний клас моделей глибинного навчання та можливість роботи з нейронними моделями глибинного навчання.

Вчені розробили електронну шкіру для інтерактивного сенсорного спілкування у віртуальному світі

Бездротова м'яка електронна шкіра може як виявляти, так і передавати відчуття дотику, а також формувати сенсорну мережу, що відкриває великі можливості для покращення інтерактивного сенсорного спілкування.

Компанія Meta розробила модель штучного інтелекту для декодування мовлення при зчитуванні мозкової активності

Декодування мовлення на основі активності головного мозку було давньою метою неврологів і клініцистів. Наразі, компанія Meta представили результати дослідження моделі ШІ, яка може декодувати мову, використовуючи неінвазивні методи дослідження.

Нова модель штучного інтелекту створює 3D об'єкти та персонажів для віртуального світу ігор

За останнє десятиліття різке зростання вартості виробництва відеоігор класу ААА стало однією з найбільш серйозних проблем в ігровій індустрії. Студії завжди шукають технології, які б могли допомогти знизити вартість розробки ігор. Останні досягнення в нейронних моделях генерації зображень вселяють надію, що реалізація цієї мрії може бути не такою вже далекою.

Філософи vs перетворювачі: нейронна мережа уособлює відомого вченого-когнітивіста

Чи можуть комп’ютери мислити? Чи можуть моделі штучного інтелекту (ШІ) бути свідомими? Ці та подібні запитання часто виникають під час обговорення нещодавнього прогресу ШІ, досягнутого за допомогою моделей природної мови GPT-3, LAMDA та інших перетворювачів. Тим не менш, вони все ще суперечливі і знаходяться на межі парадоксу, тому що зазвичай існує безліч прихованих припущень і помилкових уявлень про те, як працює мозок і що означає мислення. Немає іншого шляху, окрім як точно обґрунтувати ці припущення, а потім дослідити, як саме обробка інформації людиною може бути відтворена машинами.

Відновлення старих фотопортретів за допомогою нейронних мереж

Зараз вже нікого не здивувати фільтрами, які покращують якість фотографій. Але реставрація старих портретів поки що залишає бажати кращого. Старі фотографії бувають надто розмитими, тому звичайні методи підвищення чіткості зображень на них не працюють.

Жодна мова не буде забута

Компанія Facebook виклала у відкритий доступ проєкт NLLB (No Language Left Behind). Головною особливістю цієї розробки є охоплення понад двохсот мов, у тому числі рідкісних мов африканських та австралійських народів. Крім того, Facebook застосував новий підхід до моделі машинного навчання, де переклад здійснюється безпосередньо з однієї мови на іншу, без перехідного перекладу англійською мовою.

Новоявлена творчість ШІ: що потрібно знати про фундаментальні моделі і як вони допомагають роботам жартувати

Ви коли-небудь бачили фото чайника у формі авокадо або читали цікаву статтю, ідеї якої дивно відхиляються від заданої теми? Якщо так, то, можливо, ви стикалися з останніми тенденціями штучного інтелекту (ШІ).

Нове дослідження поєднує рекурентні нейронні мережі (RNN) з концепцією відпалу для вирішення реальних задач оптимізації

Оптимізаційні завдання передбачають визначення найбільш оптимальної реакції з безлічі варіантів, які часто можна побачити як в реальних ситуаціях, так і в більшості областей наукових досліджень. Однак багато складних завдань не можуть бути вирішені простими обчислювальними методами або вимагають багато часу.

W2V-BERT: Поєднання контрастного навчання та моделювання мови з маскою для самостійного навчання мовлення

Мотивовані успіхом маскового мовного моделювання (МЛМ) в допідготовлених моделях обробки природної мови перед навчанням, автори пропонують модель w2v-BERT, яка досліджує МЛМ для самонавчального мовного представлення.

Остання нейронна мережа OpenAI створює зображення з текстового опису

"Ми виявили, що DALL· Е має можливість створювати правдоподібні фотографії для фантастичного діапазону речень, які розкривають композиційну структуру мови", - пояснює OpenAI. Отримані зображення можуть варіюватися від ілюстрацій до об'єктів, а також виправлених реальних зображень. Нижче наведено кілька прикладів кожного з них, що поставляється OpenAI.