- Tether розширила найбільший у світі освітній ШІ-набір даних до 148 млрд токенів.
- QVAC Genesis II охопив 19 освітніх доменів.
- Компанія робить ставку на міркування.
Дослідницький підрозділ Tether Data AI (QVAC) оголосив про реліз QVAC Genesis II — другого етапу найбільшого у світі публічно доступного синтетичного освітнього набору даних для переднавчання штучного інтелекту (ШІ).
Як вказано у заяві, завдяки додаванню 107 млрд нових токенів, загальний обсяг набору даних QVAC Genesis зріс до 148 млрд токенів, охоплюючи 19 освітніх доменів. Це суттєво розширює масштаб, глибину та якість даних для навчання відкритих ШІ-моделей.
QVAC Genesis II розвиває напрацювання першого релізу Genesis I, у межах якого було представлено ретельно валідуваний синтетичний набір даних, зосереджений на базових STEM-дисциплінах.
Нова версія додає 10 нових напрямів, серед яких хімія, комп’ютерні науки, статистика, машинне навчання, астрономія, географія, економетрика та електротехніка. Також у межах оновлення повністю перегенерували університетський курс фізики з використанням удосконаленої методології.
Разом Genesis I та II формують найповніший синтетичний освітній набір даних, коли-небудь відкрито оприлюднений, йдеться в повідомленні Tether.
Ключовою інновацією релізу став новий підхід до генерації даних — Option-Level Reasoning. Він дозволяє витягувати структуроване мислення не лише з помилкових відповідей моделей, а й з правильних.
У Tether зауважили, що замість того щоб сприймати коректну відповідь як фінальний результат, система аналізує кожен варіант відповіді в тестових завданнях, підсилюючи правильну логіку та прямо працюючи з типовими хибними уявленнями. У результаті формується навчальний матеріал, орієнтований на причинно-наслідкові зв’язки, ухвалення рішень і пояснюваність, а не лише на формальну правильність.
Новий метод доповнює оригінальний метод аналізу помилок, уперше застосований у Genesis I. Разом вони утворюють подвійний метод, який гарантує, що кожне згенероване запитання має реальну освітню цінність.
Незалежні оцінки показали, що моделі, навчені на даних Genesis II, демонструють значно вищу точність міркувань і стабільніше формують чіткі та однозначні відповіді порівняно з попередніми синтетичними наборами даних.
Tether AI: навіщо емітент стейблкоіна USDT почав експансію на ринок ШІ? 05.05.2025 Читати
Tether наголосила, що цей запуск є не просто збільшенням масштабу, а зміною підходу до створення освітніх ШІ-даних. На відміну від поширеної в індустрії практики масового збирання текстів, QVAC робить акцент на навчанні моделей мислити, пояснювати та розуміти, а не лише імітувати мову.
Генеральний директор Tether Паоло Ардоїно зазначив:
«Більшість сучасного ШІ-навчання оптимізується під плинність мови, а не під розуміння. Цим релізом ми рухаємося від обсягу до структури, міркування та ясності. Інтелект має будуватися на розумінні того, чому щось є істинним, а не лише на прогнозуванні того, що звучить правильно. Відкриваючи цей набір даних, ми даємо дослідникам і розробникам інструменти для створення більш надійного, пояснюваного й корисного для суспільства ШІ».
Як і попередній реліз, QVAC Genesis II поширюється у відкритому доступі для підтримки дослідників, університетів та незалежних розробників, які працюють поза закритими пропрієтарними системами. Набір даних доступний за ліцензією Creative Commons Attribution–NonCommercial (CC-BY-NC 4.0), що підкреслює орієнтацію QVAC на відкриті та спільнотні дослідження в галузі ШІ.
Реліз також вписується у ширшу стратегію QVAC щодо розвитку локального та децентралізованого інтелекту, де моделі можуть навчатися, донавчатися та розгортатися без залежності від централізованих хмарних платформ. Посилюючи відкриту базу навчальних даних, Tether Data прагне зменшити структурні бар’єри для інновацій і зберегти доступ до якісного ШІ для глобальної наукової спільноти.
Останніми місяцями Tether активно розширює свою ШІ-екосистему. Зокрема, компанія нещодавно представила кросплатформену систему QVAC-fabric-llm для локального донавчання великих мовних моделей. Рішення інтегрує повноцінне LoRA-тренування в llama.cpp та працює завдяки Vulkan, Metal і LoRA, дозволяючи донавчати моделі Qwen3 і Gemma3 на будь-яких пристроях — від смартфонів до серверів.
Крім того, Tether запустила QVAC Health — приватний ШІ-хаб для персональних даних про здоров’я. Платформа об’єднує інформацію з фітнес-годинників, смарткілець, біометричних сенсорів і медичних застосунків у зашифровану, офлайн-сумісну панель, даючи користувачам змогу отримувати повну картину свого стану без передачі даних великим технологічним корпораціям.
Сообщение Tether заявила про запуск QVAC Genesis II появились сначала на INCRYPTED.





