Weibo's new open source AI model VibeThinker-1.5B outperforms DeepSeek-R1 on $7,800 post-training budget

ChatGPT Image Nov 12 2025 02 29 18 PM

Another day at the end of 2025, another impressive result from a Chinese company in open source artificial intelligence.

The AI ​​division of Chinese social networking company Weibo recently released its open source VibeThinker-1.5b-1.5 billion parameter large language model (LLM), a fine-tuned version of rival Chinese tech firm Alibaba’s Qwen2.5-Math-1.5b.

It is now available for free download and use by researchers and enterprise developers – even for commercial purposes – under a permissive MIT license on Hugging Face, GitHub, and ModelScope, along with a technical report on the open access science publishing site arxiv.org.

And yet, despite its compact size, VibeThinker-1.5B achieves benchmark-topping reasoning performance on math and code tasks, rivaling or surpassing models hundreds of times its size, even beating Chinese rival DeepSeek’s famous R1 that went viral earlier this year – a 671-billion parameter model – on formal reasoning benchmarks.

It outperforms Mistral AI’s Magistral Medium and holds its own against Anthropic’s Cloud Opus 4 and OpenAI’s GPT-OSS-20B Medium, while requiring a fraction of the infrastructure and investment.

It does this even after being post-trained on a budget of only $7800 USD for compute resources (3900 GPU hours on an Nvidia H800) – tens, or even hundreds, of thousands of dollars less than typically required to fine-tune similar or larger-scale models.

Remember that this is not the total cost of model development, however: the LLM is trained in stages. First comes pre-training, when the model learns basic language structure and common sense by predicting the next word in massive amounts of text from the Internet, books, and articles. This gives him fluency but not much understanding of how to follow instructions or interact

Training is then done using very small, high-quality datasets – typically a collection of example questions, prompts and expert-written answers – to teach the model how to respond helpfully, reason through problems and align with human expectations. Nevertheless, the cost-effectiveness of Weibo after training on VibeThinker-1.5B is remarkable and should be appreciated.

The open-source release overturns assumptions about parameter scale, compute intensity, and minimum viable size for high-performance LLMs.

A different training approach: spectrum-to-signal

The performance of VibeThinker-1.5B is not due to scale, but due to the training framework behind it: spectrum-to-signal principle (SSP).

Instead of optimizing a model solely for single-passage accuracy (pass@1), the SSP framework splits supervised fine-tuning (SFT) and reinforcement learning (RL) into two separate stages with different goals:

  • SFT (“spectrum phase”): The model is trained to maximize the diversity in possible correct answers, improving its PASS@K score. This creates a wide range of plausible solution paths.

  • RL (“signal phase”): A second-stage reinforcement learning method (called Maxent-Guided Policy Optimization or MGPO) is used to identify and enhance the most correct paths from this diverse solution pool. MGPO prioritizes problems where the model is most uncertain, using entropy-based weighting to focus learning.

The authors argue that this separation allows smaller models to more effectively explore the logic space – achieving signal amplification without relying on massive parameter calculations.

VibeThinker-1.5B makes a compelling case that the industry’s reliance on parameter scaling as the only path to improved logic performance may be outdated.

By adopting a diversity-first training pipeline, WeiboAI has shown that smaller, more accessible models can match and even outperform billion-dollar systems in logic-heavy tasks.

The low resource footprint is one of the most important aspects of the VibeThinker-1.5B. At less than $8,000, post-training costs are 30-60 times lower than models like DeepSeek R1 and MiniMax-M1, which cost between $294K and $535K to train.

Performance in all domains

Despite its small size, VibeThinker-1.5B provides cross-domain logic that surpasses many larger open-source and commercial models:

Sample

AIME25

livecodebench v6

GPQA-Diamond

Vibe Thinker-1.5B

74.4

51.1

46.7

gpt-oss-20b-medium

72.1

54.9

66.0

cloud opus 4

69.2

56.6

79.6

Minimax M1 (456B)

74.6

62.3

69.2

DeepSeek R1 (671B)

70.0

65.9

71.5

KM K2 (1.09T)

49.5

53.7

75.1

VibeThinker was benchmarked against both reasoning-centric models (Magistral, Cloud, OpenAI O3-Mini) and non-reasoning LLMs (GPT-4.1, KMK2, DeepSeq v3). In structured logic benchmarks, the model consistently outperformed non-logic models regardless of size:

  • On AIME24 (mathematics), it beats Kimi K2 (1.09T) by more than 10 points (80.3 vs 69.6).

  • On LiveCodeBench v6, it outperformed Cloud Opus 4 (51.1 vs 47.4).

  • On GPQA, it scored below GPT-4.1 and Cloud, but still doubled its base model (from 16.4 to 46.7).

This supports the authors’ claim that size is not the only path to reasoning ability – with proper training design, smaller models can reach or even surpass the performance of much larger systems in targeted tasks.

In particular, it achieves parity with models hundreds of times larger on math and code, although it lags in general knowledge reasoning (GPQA), where larger models maintain the lead.

This suggests a potential specialization trade-off: while VibeThinker excels at structured logical tasks, it has a poor ability to memorize extensive encyclopedias, a known limitation of smaller architectures.

Guidance for Enterprise Adoption

The release includes recommended inference settings (temp = 0.6, top_p = 0.95, max_tokens = 40960).

This model is small enough to be deployed on edge devices, including mobile phones and vehicle-embedded systems, while the cost is estimated to be 20–70 times cheaper than larger models.

This establishes VibeThinker-1.5B not only as a research achievement, but as a potential basis for cost-efficient, locally deployable logic systems.

Weibo’s strategy and market position

Weibo, launched by Sina Corporation in 2009, remains a cornerstone of China’s social media ecosystem. Often described as China’s version of X (formerly Twitter), the platform blends microblogging, multimedia content and trending-topic features with a regulatory environment shaped by stringent government oversight.

Despite counting 600 million monthly active users (more than double that of

In response, Weibo has leaned toward creator-economy monetization, live-streaming, and vertical video — adding tools for influencer engagement, e-commerce integration, and rich analytics for brands.

The platform’s role as a digital public square also makes it the focus of regulatory scrutiny. Chinese authorities continue to exert pressure on issues ranging from content governance to data security. In September 2025, Weibo was one of the platforms cited in official warnings, highlighting its continued exposure to policy risks.

Weibo’s push into AI R&D—exemplified by the release of Weibothinker-1.5b—signals a change in ambition. In addition to being a media platform, Weibo is positioning itself as a player in the next phase of Chinese AI development by using its capital reserves, user behavior data, and in-house research capacity to pursue adjacent technological domains.

What this means for enterprise technology decision makers

For engineering leaders and enterprise AI teams, the release of Vibethinker has practical implications for everything from orchestration pipelines to cost modeling.

A 1.5B-parameter model that outperforms a 100x larger model on math and programming tasks not only saves computation – it changes the architectural balance. This enables LLM inference on constrained infrastructure, reduces latency at the edge, and lowers the barrier to entry for applications that would otherwise require API access to closed, frontier-scale models.

This matters for enterprise ML leaders trying to deploy reasoning-enabled agents within existing systems or for platform owners looking to integrate ML into automated workflows.

It also speaks to those managing reinforcement learning from human feedback (RLHF) pipelines or inference optimization in hybrid cloud environments.

The model’s post-training methodology—specifically its entropy-targeted reinforcement learning approach—provides a roadmap for teams refining smaller checkpoints rather than relying on massive pre-training.

VibeThinker’s benchmark transparency and data refinement steps also address another emerging priority in enterprise AI: auditability. While its performance on general-knowledge tests still lags behind the larger Frontier models, its task-specific reliability makes it an attractive candidate for controlled environments where accuracy matters more than coverage.

In short, VibeThinker-1.5B is not just a research milestone – it is a strong candidate for practical enterprise use, deployment, and learning. This suggests that a new class of compact, logic-optimized models is viable for enterprise use cases that were previously the domain of much larger systems. For organizations trying to balance cost, latency, interpretability, and control, this is a great new option to the long, growing list of Chinese open source offerings.



14 thoughts on “Weibo's new open source AI model VibeThinker-1.5B outperforms DeepSeek-R1 on $7,800 post-training budget”

  1. Хай всем! Решил рассказать простым лайфхаком по определению печенья в браузере. Часто бывает, что требуется незамедлительно найти определённые файлы куки, чтобы разобраться с зафиксированной информацией или удалить специфические печенья. Для этого следует задействовать профессиональными средствами и утилитами, которые существенно улучшают процесс.

    Когда желаете протестировать что-то удобное, советую посмотреть вот этот ресурс [url=https://ya22.net]Поиск печенек[/url] , где полно раскрыты варианты нахождения и администрирования куки в всевозможных браузерах. Это действительно сохраняет время и помогает более полно осмысливать, что фактически сохраняется на личном устройстве. Предполагаю, отдельные пользователи признает это нужным!

    Reply
  2. Когда вы планируете визит в Париж и хотите узнать больше с его легендарными местами, настоятельно рекомендую обязательно посетить такие памятники, как Эйфелева башня, собор Парижской Богоматери, гревская площадь и люксембургский сад. Для ценителей истории заинтересуют дворец правосудия Париж, консьержери и булонский лес. Собрать важную информацию о свободных для посещения музеях Парижа и других зонах можно на сайте округа паристи .

    В дополнение к традиционных мест необходимо заглянуть в монмартр с его погостом и музеем Родена, а также ознакомиться с легендами, связанными с Марией Антуанеттой — в том числе, узнать дату и место death этой выдающейся исторической персоны. Для комфортных кафе идеально подойдут кафе де Флор и кафе де Флер, где можно испытать атмосферу Парижа. Не пропустите, что куршевель это великолепный горнолыжный курорт, а трокадеро — отличное место для кадров с видом на башню.

    Reply
  3. Если задумали поездку на Тенерифе, обязательно наведайтесь в Monkey Park Tenerife и бассейны Lago Martianez для отличного отдыха. Также важно узнать о расписании автобуса линии 343 (teneriffa bus 343 fahrplan), чтобы быстро перемещаться по острову и увидеть достопримечательности, например, пляж Тереситас и культовое драконовое дерево.

    Для тех, кто увлекается культурой и событиями, призываю заглянуть в программу Carnevale Tenerife 2025, где можно погрузиться в традициями и весельем. Дополнительно о Тенерифе, Канарских островах и их красотах можно найти информацию тут: мадейра . А если вас интересуют другие города Испании у моря, как Барселона, Валенсия или Малага, то обязательно познакомьтесь с пляжи и архитектуру, например, кафедральный собор Валенсии или парк Цитадель в Барселоне.

    Reply
  4. Организуя поездку из Неаполя в Сорренто, важно знать достоверное расстояние и комфортные варианты транспорта, будь то поезд или паром из Неаполя на Капри. Для знатоков истории стоит зарезервировать время на знакомство с Палатина в Риме — это потрясающее место с впечатляющей археологией, а также Национальный Римский музей, который открывает множество загадок Древнего Рима.

    Если вы собираетесь максимально использовать целый день в Венеции, советую пеший маршрут по Венеции, который предоставит шанс охватить знаковые площади и достопримечательности, включая площадь Венеции и поездку на гондоле (цена довольно доступна). Более развернутые советы и маршруты по Италии можно получить здесь [url=https://holidaygid4.ru]один день в венеции[/url] , это обеспечит лучше спланировать путешествие и не оставить без внимания важного.

    Reply
  5. Коли организуете поездку в Потсдам и ломаете голову, что посмотреть за один день, обязательно советуем посмотреть на дворец Сан-Суси, Голландский квартал и японский сад. Кроме обычных достопримечательностей Потсдама, следует заглянуть в кинопарк Бабельсберг и замок Вальдек, чтобы приобрести всестороннее представление об этом изумительном городе. Для поклонников природы здесь также множество парков Германии, где можно чудесно провести время и насладиться красотой ландшафта.

    Ежели вам интересно, что посетить в Дюссельдорфе, не пропустите блошиный рынок с его оригинальной атмосферой и многообразием товаров (адрес и расписание запросто найти на фантазия ленд ), а также японский парк, который ранее назывался японским садом Дюссельдорфа. Почитателям подвижного отдыха и совместного с семьёй времяпрепровождения подойдёт Фантазия Ленд — советуем заранее проверить с ценами на билеты и аттракционами. Такие вариативные направления превратят ваше путешествие по Германии интенсивным и запоминающимся.

    Reply
  6. Если намечаете отдых на озере Шира, советую обратить внимание на места отдыха на Шира, которые располагают разные варианты проживания. Так, база отдыха Шира Жемчужный известна удобными домиками и даже бассейном, что обеспечивает отдых превосходным и содержательным. Для тех, кто подбирает жилье рядом с природой, базы отдыха Шира с видом на озеро — замечательный выбор, а чтобы глубже понять варианты, можно найти информацию здесь: сад камней шира .

    В особенности интересны базы отдыха Три Звезды Шира и Бегущая по Волнам, которые обеспечивают достойный сервис и различные развлечения. Если хотите узнать, где остановиться у озера Шира или актуальна цена на домики в Шира Жемчужный, важно изучите мнения и фото на форумах, а также рассмотрите такой уникальный объект, как Сад Камней Шира, что подарит изюминку вашему отдыху.

    Reply
  7. Разрабатывая отпуск в Таиланд, немало людей задаются вопросом — Пхукет или Самуи? Данные острова известны своими невероятными пляжами, и если волнуют пляжи Самуи, следует посмотреть карту, чтобы отобрать именно тот берег, который вам по душе. Для тех, кто беспокоится о безопасности, безусловно стоит узнать информацию о цунами в Тайланде 2004, тем более если речь идет о Пхукете — там есть огромное количество фото и отзывов о воссоздании после трагедии.

    К тому же, важно продумать финансовую сторону — сколько денег планировать на Пхукет или Тайланд в целом на 10 дней, а также ознакомиться про обмен валюты на Пхукете, найм байка и среднюю стоимость массажа. Есть немало полезных отзывов по таким темам, например, на сайте пхукет самуи как добраться , где можно отыскать отзывы о дайвинге, океанариуме на Пхукете и самых прекрасных пляжах Самуи. Обязательно ознакомиться с правилами въезда в Таиланд 2025 и что разумнее брать с собой, чтобы отдых состоялся максимально комфортно.

    Reply
  8. Организуя поездку в Таиланд, множество туристов задаются вопросом, сколько стоит отдых в Тайланд и сколько брать денег на отдых. Допустим, путёвка в Тайланд расценки обусловлена сезона — желательно ехать в Тайланд, Пхукет в интервал с ноября по февраль, когда погодные условия максимально оптимальная. На Пхукете желательно познакомиться с рынком Патонг и торговыми центрами на Патонге, где можно не только взять сувениры, но и испытать необычные фрукты Таиланда. Подробнее про цены, маршруты и трансферы, и паром Пхукет Самуи, можно почитать здесь сколько денег взять в тайланд .

    Что касается ориентирования, в аэропорту Пхукета дело сравнительно доступно: основная среди ключевых задач — отыскать самый приемлемый обменник на Пхукете или проверенное такси до отеля. За 10 дней на Пхукете нередко рекомендуют иметь с собой сумму, составляющую порядка 30-40 тысяч бат, чтобы свободно погасить заказ байка, массаж и пропитание. Если возникает вопрос, что оптимальнее — Самуи или Пхукет, то любой остров замечателен по-своему, и всё основывается на ваших приоритетов, скажем, атмосферу пляжей или прогулочные маршруты.

    Reply
  9. Когда сталкиваешься с утратой близкого человека, важно найти надежную ритуальные услуги минск круглосуточно, которая поможет организовать достойное прощание.

    Это требует чуткого отношения и внимания ко многим деталям. В белорусской столице работает немало организаций, предлагающих ритуальные услуги, однако найти достойного подрядчика – задача не из легких.

    Следует учитывать, что стоимость ритуальных услуг зависит от многих факторов. На цену влияют выбранные ритуальные принадлежности, стоимость транспорта и другие аспекты. В связи с этим советуем заранее уточнить все детали и ознакомиться с полным прайс-листом.

    Выбор ритуального агентства: на что обратить внимание

    Выбирая похоронное бюро важно обратить внимание на ее опыт и отзывы. Изучите отзывы в интернете, поговорите с представителями, чтобы составить собственное впечатление. Наличие лицензии и сертификатов также имеет немаловажное значение.

    Удостоверьтесь, что агентство предлагает комплексное обслуживание, включая оформление документов. Собственный автопарк и ритуального зала для прощания – важные факторы.

    Оформление документов и организация церемонии

    Завершение формальностей – неотъемлемая часть организации похорон. сбор всех необходимых справок. Это значительно облегчит.

    Проведение траурного мероприятия – ответственный шаг, позволяющий достойно проводить усопшего. Выбор места проведения и родственников и близких.

    Дополнительные услуги и поддержка

    В дополнение к базовым ритуальные агентства могут предложить дополнительные услуги, например, организацию поминок. Психологическая поддержка также в сложный момент.

    Важно помнить, что проведение погребения – требует индивидуального подхода. Остановите свой выбор на агентстве, которое предложит и окажет необходимую поддержку.

    **Спин-шаблон:**

    “`
    Он требует внимательного подхода и внимания ко многим деталям. В Минске представлен широкий спектр фирм, предлагающих ритуальные услуги, однако найти достойного подрядчика – может оказаться сложной задачей.

    Необходимо знать, что стоимость ритуальных услуг подвержена колебаниям. Определяют стоимость выбранные ритуальные принадлежности, затраты на перевозку и иные параметры. В связи с этим советуем заранее уточнить все детали и ознакомиться с полным прайс-листом.

    Выбор ритуального агентства: на что обратить внимание важно обратить внимание на ее опыт и отзывы. Изучите отзывы в интернете, поговорите с представителями, чтобы получить представление о работе. Наличие лицензии и сертификатов также играет существенную роль.

    Убедитесь, что агентство предлагает комплексное обслуживание, в том числе подготовку необходимых бумаг. Автомобили в собственности и специального зала для отпевания – дополнительные преимущества.

    Завершение формальностей – обязательный этап организации похорон. Бюро ритуальных услуг. нагрузку на родственников.

    Проведение траурного мероприятия – важный этап, помогающий попрощаться с близким человеком. Решение о выборе кладбища и основываются на волеизъявлении.

    Помощь и дополнительные сервисы ритуальные агентства как правило, предоставляют дополнительные услуги, например, организацию поминок. Психологическая поддержка также может оказаться необходимой.

    Следует знать, что похоронный процесс – является делом личным. Остановите свой выбор на агентстве, которое предложит и окажет всестороннюю помощь.
    “`

    Reply
  10. Дозвольте мені представити інформаційний ресурс, який, швидше за все, стане корисним джерелом для наших обговорень – Karpaty.net.ua. Незважаючи на назву, що апелює до з туристичними напрямками, сайт займається зовсім іншою і серйозною тематикою. Він представляє себе як серйозна та глибока новинно-аналітична платформа з актуальним фокусом.

    Основним фокусом Karpaty.net.ua є глибоке висвітлення ключових для України та регіону тем:

    – Міжнародна політика та безпека: Ресурс детально аналізує процес євроінтеграції України, дипломатичні візити, питання членства в НАТО та реалізацію міжнародних санкційних пакетів.
    – Події російсько-української війни: Тут публікуються не лише оперативні новини з фронту, але й аналітичні матеріали, коментарі експертів та дайджести, що сприяють розумінню контекст та наслідки подій.
    – Внутрішній соціально-політичний контекст: Сайт також зачіпає важливі суспільні процеси, попередження про небезпечні погодні явища та розміщує корисну інформацію на життєві питання (зокрема, про здоров’я).

    Чим відрізняється цей ресурс таким корисним для таких спільнот, як наша? Насамперед, глибина матеріалів. На відміну від коротких заголовків автори пропонують глибокі тексти з аналізом причин і наслідків подій. Наприклад, можна знайти детальний розбір дипломатичних кроків навколо нового пакету санкцій ЄС або експертні оцінки візитів високопосадовців до регіонів, що є в фокусі міжнародної уваги.

    Крім того, Karpaty.net.ua пропонує різні формати контенту, такі як текстові аналітичні статті та подкасти. Це забезпечує доступність інформації для комфортного сприйняття.

    Редакція швидко реагує на головні події, що дозволяє бути в темі актуальної ситуації. Для відвідувачів, які цікавляться не просто поверхневими фактами, а прагнуть розбиратися в комплексних суспільно-політичних процесах, цей сайт може стати корисним джерелом для аналізу різних точок зору, отримання перевірених даних та подальшого якісного обговорення в темі.

    Karpaty.net.ua – вартий ознайомлення і пропонуємо ознайомитися з його матеріалами. Ваша позиція та думки щодо контенту ресурсу також будуть цікавими для спілкування.

    Reply

Leave a Comment