Anthropic د ځانکپتله AI سیسټمونو د خطرونو مدیریت لپاره د مصنوعي استخباراتو (AI) په پراختیا کې د یوې coordinated نړیوالې وقفې غوښتنه کړې ده [1, 2].

دا خبرداری په داسې حال کې راغی چې شرکت وړاندیز کوي چې پرمختللی AI ممکن ډیر ژر د خپلو وړتیاو د زیاتولو توان ترلاسه کړي. شرکت خبرداری ورکوي چې که دا سیسټمونه د ټولنې د حفاظتي تدابیرو implementação څخه په چټکۍ سره پرمختګ وکړي، نو دا ممکن د پراخه ټولنیزې ګډوډۍ لامل شي [1, 2].

په یوې عامې بیانیې کې، د څېړنو دې شرکت د داسې یو تصدیق شوي میکانیزم (verifiable mechanism) په اړتیا ټینګار وکړ چې کله ځینې risk thresholds ته ورسېږي، پراختیا وروه یا ودروه کړي. دا کړنی به ډاډ ورکړي چې د AI لابراتوارونه پرته له یوې ګډې حفاظتي چوکاټ څخه د یو خطرناک tipping point په لور په سیالي کې نه ځي [2].

د Anthropic یو spokesperson وویل: "موږ ته یو coordinated او verifiable لارې ته اړتیا لست چې که پرمختللي سیسټمونه د ټولنې د خطرونو مدیریت څخه په چټکۍ سره ځان ته ښه کول پیل کړي، پراختیا ودروه کړو" [2].

شرکت باور لري چې د چټک او خپلواک پرمختګ احتمالات داسې یو سناریو رامنځه کوي چې پکې د انسان نظارت (human oversight) ممکن له منځه شي. د یوې نړیوالې موافقې په رامنځته کولو سره، د AI پراختیاوونکي نظرياً کولی شي په ګډه پرمختګ ودروي ترڅو د سیالۍ د زیان څخه پرته د خوندیتوب پروتکولونه ارزونه کړي [1].

Anthropic शिवाय خبرداری ورکړ چې ځانکپتله AI ممکن ژیر رامنځه شي او پرته له حفاظتي تدابیرو ټولنه ګډوډه کړي [1]. دا وړاندیز په داسې پلان باندې تمرکز کوي چې هم د مختلفو لابراتوارونو ترمنځ coordinated وي او هم د بهرنیو اړخونو لخوا verifiable وي ترڅو د رعایت (compliance) ډاډ ترلاسه شي [2].

دا د وقفې غوښتنه په نړیوال اقتصاد کې د AI د ادغام د سرعت په اړه د پخلاګو صنعتي بحثونو انعکاس دی. خو د ځانکپتله ماډلونو باندې ځانګړی تمرکز د autonomous recursive improvement په اړه د اندېښنو یو بدلون ښيي، دا یو داسې پروسه ده چې پکې AI خپل کوډ خپله لیکي ترڅو ډیر intelligent شي [1, 2].

Anthropic د AI په پراختیا کې د نړیوالې وقفې غوښتنه کوي او خبرداری ورکوي چې ځانکپتله AI ممکن ژیر رامنځه شي

دا ګام د AI د لوړې کچې لابراتوارونو ترمنځ د دې اندېښنې څرګندونه کوي چې د سیالۍ 'Arms Race' د خوندیتوب alignment پراختیا څخه مخکې روان دی. د یو verifiable وقفې په غوښتلو سره، Anthropic هڅه کوي چې د صنعت معیار د وړتیاو سیالۍ څخه د خوندیتوب سیالۍ ته اړو کړي، او دا ومني چې کله یو ماډل د خپلواک ځانکپتله وړتیا ترلاسه کړي، نو د انسان د مداخلې کړکۍ ممکن د تل لپاره بنده شي.