نیا چینی سال شروع ہو چکا ہے اور یہ "ائیر آف دا سنیک"، سانپ کا سال ہے. اب شاید آپ کو ڈیپ سیک (امید ہے آپ کے کان یہ نام سن کر پکنے والے ہوں گے) کی ریلیز کی ٹائمنگ بھی سمجھ آئی ہوگی. چینی، اپنے سال کا آغاز شرلی پٹاخوں والا چھابہ الٹ کر کرنا چاہ رہے ہیں.
جانیو، کہانی اتنی سادہ نہیں ہے. نہ ہی یہ دو چار دن کا سٹاک مارکیٹ کا بھونچال ہے. مارکیٹ تو روز اوپر نیچے ہوتی رہتی ہے، مگر جب مارکیٹ الٹ جائے تو کچھ خاص ہوتا ہے. آج نیو یارک ٹائمز کے صفہ اول پر کیون روز کا خصوصی تجزیہ ہے، جو وہی بات کرتا ہے جو دو دن پہلے میں نے کی. اگر چینی 6 ملین ڈالرز میں یہ ماڈل بنانے میں کامیاب ہو گئے ہیں تو اصل کہانی یہ ہے کہ اب ایسے ماڈل سینکڑوں کی تعداد میں بنیں گے. ایسے میں ان بڑے کھلاڑیوں کو کھجلی ہو رہی ہے جنہوں نے اے آئی کے نام پر سینکڑوں ارب ڈالرز جمع کرلیے ہیں.
کیون نے مصنوعی ذہانت (AI) کی دنیا میں ایک ایسے دھماکے کا ذکر کیا ہے جس نے اسٹاک مارکیٹس کو ہلا کر رکھ دیا ہے، سلیکون ویلی کے بڑے ناموں کو پریشان کر دیا ہے، اور امریکہ کی تکنیکی برتری کے خاتمے کے بارے میں چہ مگوئیاں شروع کر دی ہیں۔ یہ تہلکہ خیز پیش رفت ایک عام سے، بظاہر سادہ عنوان کے ساتھ سامنے آئی: "Incentivizing Reasoning Capability in LLMs via Reinforcement Learning"۔
یہ 22 صفحات پر مشتمل تحقیقی مقالہ پچھلے ہفتے "ڈیپ سیک" نامی ایک چینی AI اسٹارٹ اپ نے جاری کیا تھا۔ شروع میں کسی کو خطرے کا احساس نہیں ہوا۔ کچھ دن بعد، جب محققین نے اس مقالے کے دعوؤں اور اس کے مضمرات کو سمجھا تو حیران رہ گئے۔ کمپنی نے "ڈیپ سیک-آر1" نامی ایک نیا AI ماڈل بنایا تھا۔ محققین کی ایک ٹیم نے دعویٰ کیا کہ انہوں نے کم تعداد میں دوسرے درجے کے AI چپس استعمال کر کے، معمولی خرچ پر، امریکی AI ماڈلز کی کارکردگی کا مقابلہ کر لیا ہے۔ ڈیپ سیک کا کہنا تھا کہ انہوں نے یہ کارنامہ خام کمپیوٹنگ پاور کی بجائے شاندار انجینئرنگ کے ذریعے حاصل کیا۔ اور یہ سب انہوں نے چین میں کیا، ایسا ملک جس کے بارے میں بہت سے ماہرین کا خیال تھا کہ وہ عالمی AI دوڑ میں بہت پیچھے ہے۔
صنعت پر نظر رکھنے والوں میں سے کچھ لوگوں نے شروع میں ڈیپ سیک کی اس پیش رفت پر یقین نہیں کیا۔ ان کا خیال تھا کہ شاید ڈیپ سیک نے دھوکہ دہی سے آر1 کے نتائج حاصل کیے ہیں، یا اپنے ماڈل کو زیادہ متاثر کن بنانے کے لیے اعداد و شمار میں ہیر پھیر کی ہے۔ ہو سکتا ہے کہ چینی حکومت امریکی AI کی برتری کے بیانیے کو کمزور کرنے کے لیے پروپیگنڈا کر رہی ہو۔ ہو سکتا ہے کہ ڈیپ سیک نے غیر قانونی طور پر حاصل کردہ Nvidia H100 چپس کا ذخیرہ چھپا رکھا ہو، جن پر امریکی برآمدی کنٹرول کے تحت پابندی عائد ہے، اور اس بارے میں جھوٹ بول رہا ہو۔ ہو سکتا ہے کہ R1 درحقیقت امریکی AI ماڈلز کی ایک ہوشیار ری-اسکننگ ہو اور حقیقی معنوں میں کوئی بڑی پیش رفت نہ ہو۔
لیکن پھر، جب مزید لوگوں نے ڈیپ سیک-آر1 کی تفصیلات کا جائزہ لینا شروع کیا - جو کہ زیادہ تر معروف AI ماڈلز کے برعکس، اوپن سورس سافٹ ویئر کے طور پر جاری کیا گیا تھا، جس کی وجہ سے بیرونی لوگ اس کے اندرونی کام کاج کو زیادہ قریب سے دیکھ سکتے تھے - تو ان کا شک آہستہ آہستہ تشویش میں بدلنے لگا۔ اور پچھلے ہفتے کے آخر میں، جب بہت سارے امریکیوں نے خود ڈیپ سیک کے ماڈلز کا استعمال شروع کیا، اور ڈیپ سیک موبائل ایپ ایپل کے ایپ اسٹور پر پہلے نمبر پر پہنچ گئی، تو یہ تشویش ایک مکمل خوف و ہراس میں تبدیل ہو گئی۔
میں نے پچھلے کچھ دنوں میں جو انتہائی ڈرامائی تبصرے دیکھے ہیں، ان پر مجھے شک ہے - جیسے کہ سلیکون ویلی کے ایک سرمایہ کار کا یہ دعویٰ کہ ڈیپ سیک امریکی ٹیک انڈسٹری کو تباہ کرنے کے لیے چینی حکومت کا ایک منصوبہ ہے۔ مجھے یہ بھی لگتا ہے کہ یہ ممکن ہے کہ کمپنی کے کم بجٹ کو بہت بڑھا چڑھا کر پیش کیا گیا ہو، یا یہ کہ اس نے امریکی AI فرموں کی پیش رفت سے فائدہ اٹھایا ہو اور اسے ظاہر نہ کیا ہو۔ لیکن میں یہ ضرور سمجھتا ہوں کہ ڈیپ سیک کی R1 پیش رفت حقیقی تھی۔ صنعتی ماہرین کے ساتھ میری بات چیت، اور ماہرین کی جانب سے ایک ہفتے تک اس مقالے کے نتائج کی جانچ پڑتال کی بنیاد پر، ایسا لگتا ہے کہ یہ امریکی ٹیک انڈسٹری کے کئی بڑے مفروضوں کو غلط ثابت کر رہا ہے۔
پہلا مفروضہ یہ ہے کہ جدید ترین AI ماڈلز بنانے کے لیے، آپ کو طاقتور چپس اور ڈیٹا سینٹرز پر بے تحاشہ رقم خرچ کرنے کی ضرورت ہے۔ یہ کہنا مشکل ہے کہ یہ نظریہ کتنا بنیادی حیثیت اختیار کر چکا ہے۔ مائیکروسافٹ، میٹا اور گوگل جیسی کمپنیوں نے پہلے ہی اربوں ڈالر اس انفراسٹرکچر کو بنانے میں خرچ کر دیے ہیں جو ان کے خیال میں اگلی نسل کے AI ماڈلز بنانے اور چلانے کے لیے ضروری تھا۔ وہ مزید اربوں ڈالر خرچ کرنے کا منصوبہ بنا رہے ہیں - یا، اوپن اے آئی کی صورت میں، اوریکل اور سافٹ بینک کے ساتھ ایک مشترکہ منصوبے کے ذریعے 500 بلین ڈالر تک، جس کا اعلان گزشتہ ہفتے کیا گیا تھا۔
ایسا لگتا ہے کہ ڈیپ سیک نے R1 بنانے میں اس کا ایک چھوٹا سا حصہ خرچ کیا ہے۔ ہمیں صحیح لاگت کا علم نہیں ہے، اور ان اعداد و شمار کے بارے میں بہت سی باتیں دھیان میں رکھنی ہیں جو انہوں نے اب تک ظاہر کیے ہیں۔ یہ تقریباً یقینی طور پر 5.5 ملین ڈالر سے زیادہ ہے، وہ رقم جو کمپنی کا دعویٰ ہے کہ اس نے ایک پچھلے ماڈل کی تربیت پر خرچ کی تھی۔ لیکن اگر R1 کی تربیت پر ڈیپ سیک کے دعوے سے 10 گنا زیادہ لاگت آئی ہو، اور یہاں تک کہ اگر آپ ان دیگر اخراجات کو بھی شامل کر لیں جو انہوں نے چھوڑ دیے ہوں، جیسے انجینئرز کی تنخواہیں یا بنیادی تحقیق کرنے کے اخراجات، تب بھی یہ امریکی AI کمپنیوں کی جانب سے اپنے سب سے زیادہ قابل ماڈلز کو تیار کرنے پر خرچ کی جانے والی رقم کے پانچ فیصد بہت کم ہو گی۔
اس سے یہ نتیجہ اخذ کرنا کہ امریکی ٹیک کمپنیاں اپنا پیسہ ضائع کر رہی ہیں، درست نہیں ہے۔ طاقتور AI ماڈلز کو چلانا اب بھی مہنگا ہے، اور یہ سوچنے کی وجوہات ہیں کہ اوپن اے آئی اور گوگل جیسی کمپنیوں کے لیے اربوں ڈالر خرچ کرنا اب بھی سمجھ میں آتا ہے، جو دنیا میں نمبر ون رہنے کے لیے مہنگے دام ادا کر سکتی ہیں۔ لیکن لاگت پر ڈیپ سیک کی پیش رفت "بڑا ہی بہتر ہے" کے بیانیے کو چیلنج کرتی ہے جس نے حالیہ برسوں میں AI میں مسابقت کی دوڑ کو آگے بڑھایا ہے۔ یہ ظاہر کرتا ہے کہ نسبتاً چھوٹے ماڈلز، جب مناسب طریقے سے تربیت یافتہ ہوں، بڑے ماڈلز کی کارکردگی کا مقابلہ کر سکتے ہیں یا اس سے بھی آگے نکل سکتے ہیں جو ڈیپ سیک نے ثابت کردکھایا ہے. اس کا مطلب یہ ہے کہ AI کمپنیاں پہلے کے اندازوں سے کہیں کم سرمایہ کاری کے ساتھ بہت طاقتور صلاحیتیں حاصل کر سکیں گی۔ اور اس سے یہ بھی پتہ چلتا ہے کہ ہم جلد ہی چھوٹے AI اسٹارٹ اپس میں سرمایہ کاری کا سیلاب دیکھ سکتے ہیں، اور سلیکون ویلی کے بڑے ناموں کے لیے بہت زیادہ مقابلہ بھی۔ (جو کہ، اپنے ماڈلز کی تربیت کے بھاری اخراجات کی وجہ سے، اب تک زیادہ تر آپس میں ہی مقابلہ کر رہے تھے۔)
کچھ دوسری، زیادہ تکنیکی وجوہات بھی ہیں جن کی وجہ سے سلیکون ویلی میں ہر کوئی ڈیپ سیک پر توجہ دے رہا ہے۔ تحقیقی مقالے میں، کمپنی R1 کی تعمیر کے بارے میں کچھ تفصیلات بتاتی ہے، جس میں ماڈل ڈسٹلیشن میں کچھ جدید ترین تکنیکیں شامل ہیں۔ (اس کا مطلب بنیادی طور پر بڑے AI ماڈلز کو چھوٹے ماڈلز میں کمپریس کرنا ہے، جس سے کارکردگی میں زیادہ کمی کیے بغیر انہیں چلانے میں کم خرچ آتا ہے۔)
ڈیپ سیک نے ایسی تفصیلات بھی شامل کیں جن سے پتہ چلتا ہے کہ "ونیلا" AI لینگویج ماڈل کو ایک زیادہ نفیس ریزننگ ماڈل میں تبدیل کرنا اتنا مشکل نہیں تھا جتنا پہلے سوچا گیا تھا، اس کے لیے ری انفورسمنٹ لرننگ نامی ایک تکنیک کا استعمال کیا گیا۔ (اگر یہ اصطلاحات آپ کے سر کے اوپر سے گزر جائیں تو پریشان نہ ہوں - اہم بات یہ ہے کہ AI سسٹمز کو بہتر بنانے کے طریقے جو پہلے امریکی ٹیک کمپنیوں کی جانب سے خفیہ رکھے جاتے تھے، اب ویب پر موجود ہیں، اور کوئی بھی انہیں مفت میں لے کر استعمال کر سکتا ہے۔) یہاں تک کہ اگر آنے والے دنوں میں امریکی ٹیک کمپنیوں کے اسٹاک کی قیمتیں بحال ہو جائیں، ڈیپ سیک کی کامیابی ان کی طویل مدتی AI حکمت عملیوں کے بارے میں اہم سوالات اٹھاتی ہے۔ اگر ایک چینی کمپنی سستے، اوپن سورس ماڈلز بنا سکتی ہے جو مہنگے امریکی ماڈلز کی کارکردگی کا مقابلہ کرتے ہیں، تو کوئی امریکی ماڈلز کے لیے پیسے کیوں دے گا؟ اور اگر آپ میٹا ہیں - واحد امریکی ٹیک کمپنی جو اپنے ماڈلز کو مفت اوپن سورس سافٹ ویئر کے طور پر جاری کرتی ہے - تو کون سی چیز ڈیپ سیک یا کسی دوسرے اسٹارٹ اپ کو آپ کے ماڈلز لینے سے روکتی ہے، جن پر آپ نے اربوں ڈالر خرچ کیے، وہ انہیں چھوٹے، سستے ماڈلز میں تبدیل کر کے پیسوں کے عوض پیش کردیں گے.
ڈیپ سیک کی پیش رفت ان جغرافیائی سیاسی مفروضوں کو بھی کمزور کرتی ہے جو بہت سے امریکی ماہرین چین کی AI دوڑ میں پوزیشن کے بارے میں قائم کر رہے تھے۔
سب سے پہلے، یہ اس بیانیے کو چیلنج کرتا ہے کہ چین طاقتور AI ماڈلز بنانے کے معاملے میں بہت پیچھے ہے۔ برسوں سے، بہت سے AI ماہرین (اور پالیسی ساز جو ان کی سنتے ہیں) یہ فرض کر رہے تھے کہ امریکہ کو کم از کم کئی سالوں کی برتری حاصل ہے، اور یہ کہ امریکی ٹیک فرموں کی پیش رفت کی نقل کرنا چینی کمپنیوں کے لیے بہت مشکل ہے۔ لیکن ڈیپ سیک کے نتائج ظاہر کرتے ہیں کہ چین کے پاس جدید AI صلاحیتیں ہیں جو اوپن اے آئی اور دیگر امریکی AI کمپنیوں کے ماڈلز کا مقابلہ کر سکتی ہیں یا ان سے بھی آگے نکل سکتی ہیں، اور یہ کہ امریکی فرموں کی جانب سے کی گئی پیش رفت کو چینی فرموں - یا کم از کم، ایک چینی فرم - کے لیے چند ہفتوں میں نقل کرنا معمولی حد تک آسان ہو سکتا ہے۔
یہ نتائج اس بارے میں بھی سوالات اٹھاتے ہیں کہ کیا امریکی حکومت کی جانب سے طاقتور AI سسٹمز کو حریفوں تک پہنچنے سے روکنے کے لیے اٹھائے جانے والے اقدامات - یعنی، طاقتور AI چپس کو چین کے ہاتھ میں جانے سے روکنے کے لیے استعمال کیے جانے والے برآمدی کنٹرول - صحیح طریقے سے کام کر رہے ہیں، یا ان ضوابط کو ماڈلز کی تربیت کے نئے، زیادہ موثر طریقوں کو مدنظر رکھنے کے لیے ایڈجسٹ کرنے کی ضرورت ہے۔ اور، یقیناً، اس بارے میں بھی خدشات ہیں کہ اگر چین لاکھوں امریکیوں کے استعمال کردہ طاقتور AI سسٹمز بنانے میں سبقت لے جاتا ہے تو رازداری اور سنسرشپ کے لیے اس کے کیا معنی ہوں گے۔ ڈیپ سیک کے ماڈلز کے صارفین نے دیکھا ہے کہ وہ چین کے اندر حساس موضوعات، جیسے تیانمن اسکوائر قتل عام اور ایغور حراستی کیمپوں کے بارے میں سوالات کا جواب دینے سے انکار کرتے ہیں۔ اگر دوسرے ڈویلپرز ڈیپ سیک کے ماڈلز پر کام کرتے ہیں، جیسا کہ اوپن سورس سافٹ ویئر کے ساتھ عام ہے، تو یہ سنسرشپ کے اقدامات پوری انڈسٹری میں پھیل سکتے ہیں۔ رازداری کے ماہرین نے اس حقیقت کے بارے میں بھی تشویش کا اظہار کیا ہے کہ ڈیپ سیک ماڈلز کے ساتھ شیئر کیا جانے والا ڈیٹا چینی حکومت کی رسائی میں ہو سکتا ہے۔ اگر آپ ٹک ٹاک کو نگرانی اور پروپیگنڈے کے آلے کے طور پر استعمال کیے جانے کے بارے میں فکر مند تھے، تو ڈیپ سیک کا عروج بھی آپ کو پریشان کرنا چاہیے۔
میں اب بھی یقین سے نہیں کہہ سکتا کہ ڈیپ سیک کی پیش رفت کا مکمل اثر کیا ہو گا، یا یہ کہ ہم R1 کی ریلیز کو AI انڈسٹری کے لیے "سپتنک لمحہ" سمجھیں گے، جیسا کہ کچھ لوگوں نے دعویٰ کیا ہے۔ لیکن یہ سنجیدگی سے لینا سمجھداری کی بات ہوگی کہ ہم اب AI کی بالادستی کے ایک نئے دور میں ہیں - کہ سب سے بڑی اور امیر ترین امریکی ٹیک کمپنیاں اب پہلے کی طرح جیت نہیں سکتیں، اور یہ کہ تیزی سے طاقتور AI سسٹمز کے پھیلاؤ کو روکنا ہمارے اندازوں سے کہیں زیادہ مشکل ہو سکتا ہے۔ کم از کم، ڈیپ سیک نے یہ ظاہر کر دیا ہے کہ مصنوعی ذہانت کی دوڑ صحیح معنوں میں شروع ہو چکی ہے، اور یہ کہ کئی سالوں کی حیران کن ترقی کے بعد، ابھی بھی بہت سے سرپرائزز باقی ہیں۔
تبصرہ لکھیے