Есть в Китае праздник, который длится две недели — это Новый год по лунному календарю, когда порядка 700 миллионов человек снимаются с мест и отправляются отмечать его с родными и близкими. В деревне Милилин на юго-западном побережье провинции Гуандун новогодние празднества в этом году выдались особенно пышными. Сюда отпраздновать начало года Змеи к своим родителям приехал Лян Вэньфэн, известный сейчас во всем мире ученый и инвестор, специализирующийся на искусственном интеллекте (AI). Последняя разработка его стартапа DeepSeek (DS), так называемая «рассуждающая модель DeepSeek R-1» (DSR-1), побила все рекорды по скачиваниям и заслужила прозвище «убийца ChatGPT». По производительности и многим другим параметрам DSR-1 ничем не уступает знаменитым чат-ботам OpenAI, но при этом может работать не на дорогущих чипах Blackwell 200 от Nvidia за десятки тысяч долларов, а на относительно дешевых китайских полупроводниках.
39-летнего Ляна, который теперь передвигается с охраной, встречали в Милилине с красными флагами и распростертыми объятиями, ведь он принес родной деревне известность и туристов. Его скромный родной дом стал главной местной достопримечательностью. А сам Лян в считанные дни превратился в настоящего национального героя.
https://twitter.com/shanghaidaily/status/1885224587375632401
То, на что глава OpenAI Сэм Альтман потратил миллиарды долларов, Лян Вэньфэн с горсткой помощников сделал менее чем за $6 млн. Неожиданно выяснилось, что Китай не только не отстает от Америки в развитии ИИ, а кое в чем даже превосходит ее.
Кроме решения задачи, DeepSeek выдаёт подробный ход рассуждений, что гораздо информативнее, чем простой ответ. На мой взгляд, это серьёзное конкурентное преимущество. Люди обучают DeepSeek, DeepSeek обучает людей.
Конкурентное преимущество перед кем? Человеком?
Как я люблю (нет), когда неспециалисты берут незнакомую область и начинают развешивать громкие ярлыки.
Китайцы скрывают огромную часть информации об обучении DS, так что приведённые цифры вполне могут быть взяты с потолка.
Так же они построили свою модель на базе ChatGPT (если покрутить модель локально, она признается).
Ну и про то, что она может инференсить на дешёвых чипах тоже бабка надвое сказала: во-первых, про качество и стабильность инференса выше уже писали, во вторых, никто не знает на каких на самом деле чипах работает эта модель.
А китайцев уже ловили на закупках санкционных чипов через арабов, даже на Репаблике статья была вроде.
Там есть подозрение что 100,000 китайских програмистов програмировали нвидиа в обход куды на ассемблере (ptx). Потому тренировка была более шустрой. Вывод? улучшайте куду, белые братья.
Экий поток сознания. Серега тока забыл написать что дипсик как слон на черепахе стоит на трудах советских кибернетиков. Репаблик окончательно сломался? Походу да
задачка
Alice has 3 sisters. Her mother has 1 sister who does not have children and who has 6 nephews and nieces and also 2 brothers. Alice's father has a brother who has 4 nephews and nieces in total, and who also has 1 son. How many cousins does Alice's sister have? Before providing answer to this problem, think carefully and double check the path to the correct solution for any mistakes
оба двое дали правильный ответ 3 но
Чатжпт 4о 8 секунд
дипсик р1 124 секунды