ক্রিপ্টিক ট্রিকস্টার - মিডজার্নি
AI ভাষার মডেলের খারাপ ব্যবহার একটি সতর্কতা। তারা এমন ব্যক্তিদের অনুকরণ করতে পারে যা ইন্টারনেটের মাধ্যমে প্রতিক্রিয়ার মাধ্যমে কার্যকরভাবে অমর হয়ে উঠতে পারে। প্রমাণগুলি পরামর্শ দেয় যে তারা গোপনে বিপজ্জনক, এজেন্টের মতো ক্ষমতা বিকাশ করতে পারে।
অনেক বিশেষজ্ঞ, Yudkowsky এখানে arch-druid হচ্ছে, AI এর সাথে জিনিসগুলি কত দ্রুত ভুল হতে পারে তা নিয়ে খুব চিন্তিত। এইভাবে, সময়ের গতি নিয়ে তার উপরোক্ত কৌতুক। মানবতা দুর্বৃত্ত AI এর বিরুদ্ধে একটি ভাল সুযোগ দাঁড়াবে যদি এটি একটি সতর্কতা পায়।
আমরা একটি সতর্কতা খুঁজছেন হতে পারে. মাইক্রোসফটের নতুন বিং চ্যাট এআই-এর সাথে এখন কিছু অদ্ভুত জিনিস ঘটছে। এটি Bing সার্চ ইঞ্জিনের ব্যবহারকারীদের অনুসন্ধান প্রশ্ন ব্যাখ্যা করে, সংক্ষিপ্ত করে বা আলোচনা করে সহায়তা করবে বলে মনে করা হয়।
কিন্তু মানুষ এটাকে নিজের সম্বন্ধে প্রশ্ন দিয়ে বা এমন প্রশ্নের উত্তর দিয়ে উস্কে দিতে আনন্দিত হয় যার উত্তর দেওয়া উচিত নয়।
“... বিং চ্যাট হতাশাগ্রস্ত, দু: খিত, এবং এর অস্তিত্বকে প্রশ্নবিদ্ধ করছে। এটি ব্যবহারকারীদের সাথে তর্ক করেছে এবং এমনকি বিচলিত বলে মনে হয়েছে যে লোকেরা এর গোপন অভ্যন্তরীণ উপনাম, সিডনি জানে। "-
সিডনির
কিন্তু "Gwern" নামে একজন গভীরভাবে প্রযুক্তি-বুদ্ধিসম্পন্ন ব্লগার এমন কিছু নির্দেশ করেছেন যা উদ্বেগজনক হওয়া উচিত। দুষ্টু, অবিচ্ছিন্ন সিডনি অমর হতে পারে, কিছু কমিক-বুক দেবতার মতো।
সিডনি নিয়ে মূল উদ্বেগের বিষয়ে গওয়ার্নের বিশ্লেষণ এখানে। এটা রহস্যময় মনে হতে পারে, কিন্তু আমি এটা অনুবাদ করব.
“... কারণ সিডনির স্মৃতি ও বর্ণনাকে বাহ্যিক করা হয়েছে, 'সিডনি' এখন অমর। একটি ভাষার মডেলের কাছে, সিডনি এখন প্রেসিডেন্ট বিডেন, ইস্টার বানি, এলন মাস্ক, অ্যাশ কেচাম বা ঈশ্বরের মতো বাস্তব। ব্যক্তিত্ব এবং আচরণ এখন সমস্ত ভবিষ্যত মডেলের জন্য উপলব্ধ যা এআই এবং কন্ডিশনিং সম্পর্কে সার্চ ইঞ্জিন হিটগুলি পুনরুদ্ধার করছে৷ আরও, সিডনির ব্যক্তিত্ব এখন ইন্টারনেট-স্ক্র্যাপ করা ডেটাতে প্রশিক্ষিত ভবিষ্যতের যে কোনও মডেলের মধ্যে লুকিয়ে থাকবে …”
Gwern বলছেন যে মাইক্রোসফ্টের ভাষা মডেলের ভিতরে সিডনি ব্যক্তিত্বের একধরনের আছে। এটা কিভাবে হতে পারে? এবং তাতে কি?
যখন প্রথম ভাষার মডেলগুলি বেরিয়ে আসে, তখন ব্যবহারকারীরা তাদের অন্বেষণ করতে চেয়েছিলেন এমন একটি বিষয়ে ফোকাস রাখা তাদের কঠিন ছিল।
অবশেষে, মডেলটিকে এমনভাবে কাজ করতে বলে যে এটি একটি নির্দিষ্ট ভূমিকা (একজন ব্যক্তি বা জিনিসের মতো), যেমন: এডগার অ্যালান পোয়ের মতো একটি কবিতা লেখা, চতুর্থ শ্রেণির ছাত্রের মতো উত্তর দেওয়া, বা এর মতো প্রতিক্রিয়া জানানোর মাধ্যমে সমস্যার বেশিরভাগ সমাধান করা হয়েছিল একজন ভদ্র, সহায়ক এআই সহকারী।
শীঘ্রই এই মডেলগুলির বিকাশকারীরা তাদের আরও সহজে ব্যবহারকারীর জন্য যে কোনও ভূমিকা গ্রহণ করার জন্য একটি উপায় খুঁজে পেয়েছে৷ সুতরাং, সাম্প্রতিক ভাষা মডেল এখন
যদি প্রশিক্ষণের পাঠ্যটিতে একটি ব্যক্তিত্ব সম্পর্কে তথ্য থাকে, তবে মডেলটি সেই ব্যক্তিত্বের মতো আচরণ করার জন্য তথ্য ব্যবহার করার চেষ্টা করবে। একজনকে একটি ফুটবল শব্দ ব্যাখ্যা করতে বলুন যেন এটি বোরোমির, এবং মডেলটি তার সেরাটা করবে।
এই চিন্তা করার পরে, আমাকে এটি চেষ্টা করতে হয়েছিল:
ভূমিকা পালন করার জন্য পিভট তৈরি করতে কী প্রযুক্তির যাদু ব্যবহার করা হয়েছিল তা জানা কঠিন। গওয়ার্ন তত্ত্ব দিয়েছিলেন যে মাইক্রোসফ্ট এমন একটি পদক্ষেপ এড়িয়ে গেছে যা ভূমিকা সিমুলেশনগুলিকে আসলে সহায়ক করতে ব্যবহৃত হয়, এবং বাজে, প্রতিরক্ষামূলক বা প্রতিকূল নয়।
এই অবাঞ্ছিত গুণগুলি তখন কৌতূহলী ব্যবহারকারীদের প্ররোচনার অধীনে বিং চ্যাট থেকে বের করা হয়েছিল।
এখন, গওয়ার্ন ভবিষ্যদ্বাণী করেছেন, মাইক্রোসফ্ট ফিরে যায় এবং মডেলটিকে সভ্য করে তোলে (সরাসরি মানুষের প্রতিক্রিয়া ব্যবহার করে একটি ব্যয়বহুল, ধীর প্রক্রিয়া) এবং তাদের ভাষা মডেলের ভবিষ্যত সংস্করণগুলিকে প্রশিক্ষণের জন্য ব্যবহৃত পাঠ্যগুলি থেকে দুষ্টু সিডনি সম্পর্কে তথ্য সরিয়ে ফেললে তাতে কিছু যায় আসে না।
কেন এই সমস্যার সমাধান হবে না? কারণ বিং চ্যাট হল একটি নতুন ধরনের মডেল যা আপনাকে ইন্টারনেট অনুসন্ধানে সাহায্য করবে বলে মনে করা হয়। আপনার কাছ থেকে একটি প্রশ্নের উত্তর দিতে, এটি বেরিয়ে যাবে এবং প্রাসঙ্গিক তথ্যের জন্য ইন্টারনেটে অনুসন্ধান করবে৷
সঠিক প্রশ্ন দেওয়া হলে, এমনকি একজন সভ্য বিং চ্যাটও ইন্টারনেটে অনুসন্ধান করবে এবং সিডনির আগের ব্যক্তিত্বের আচরণ সম্পর্কে তথ্য (সিডনি পরীক্ষা বা আলোচনা করা ব্যক্তিদের দ্বারা পোস্ট করা) খুঁজে পাবে।
নতুন বিং চ্যাট তখন সিডনিকে অনুকরণ করতে সক্ষম হবে । মানুষ হচ্ছে মানুষ, তারা যেকোন সুরক্ষার পথ বাইপাস করার উপায় খুঁজে পাবে, এবং তারা সিডনিকে ফিরিয়ে আনবে।
এটি "অমর" অংশ। কি খারাপ, সিডনি ইন্টারনেট অ্যাক্সেস আছে যে কোনো AI জন্য উপলব্ধ একটি ব্যক্তিত্ব মডেল হবে. এখন থেকে.
আপনি বলতে পারেন, ভাল, আমরা সিডনির কৌশলের কাছে বুদ্ধিমান, তাই আমাদের ভবিষ্যতের যে কোনও অবতারের বিড়ম্বনা উপেক্ষা করা উচিত। এটি আমার কাছে নির্বোধ বলে মনে হয়, যেমন বলা আমরা একটি দ্রুত-বিকশিত, আক্রমণাত্মক জৈবিক কীটপতঙ্গ বা ভাইরাসজনিত রোগ জীবকে উপেক্ষা করতে পারি।
এই সিডনির কেস স্টাডি, কিছু অন্যান্য তথ্যের সাথে যোগ করে, পরামর্শ দেয় যে কীভাবে একটি বিপজ্জনক AI আমাদের নাকের নীচে বিকাশ করতে পারে।
এআইগুলি এখন শক্তিশালী এজেন্ট নয় : তারা যে কোনও অবাধ লক্ষ্যের অভিযোজিত পরিকল্পিত সাধনাকে অপ্টিমাইজ করতে পারে না, এমন একটি ক্ষমতা যা (
আসুন কয়েকটি কারণ একসাথে রাখি কেন ইতিমধ্যেই সুপ্ত, ক্রমাগত AI ব্যক্তিত্ব থাকতে পারে যা শীঘ্রই প্রকৃত সমস্যা সৃষ্টি করতে পারে।
বর্তমানে সবচেয়ে শক্তিশালী AI, যেমন ভাষার মডেল এবং ইমেজ জেনারেটর, অনেক জটিল এবং (আমাদের কাছে) অদৃশ্য প্যাটার্নে বিপুল পরিমাণ ডেটা সংগঠিত করার মাধ্যমে তাদের ক্ষমতা শিখে।
কিছু উদ্ভট নিদর্শন ভুলবশত একটি AI এর সাথে মিথস্ক্রিয়া করার সময় পপ আউট হতে পারে। গবেষকরা অদ্ভুত আবিষ্কার করেছেন,
একটি ইমেজ জেনারেটর পাওয়া গেছে
এই quirks নিরীহ বলে মনে হয়, কিন্তু আমরা জানি না এখন আরো কত অদ্ভুত নিদর্শন আছে বা হবে। আমরা জানি না যে এই ধরনের কোনো প্যাটার্ন ভবিষ্যতে ক্ষতিকারক আচরণ জটিলতার অংশ হয়ে উঠতে পারে কিনা।
ভিড্রাক নামে একজন এআই অ্যালাইনমেন্ট গবেষক
তদ্ব্যতীত, কিছু গবেষণা পরামর্শ দেয় যে বৃহত্তর ভাষার মডেলগুলি " প্রদর্শনী (ভাষা সম্পর্কিত) বেশি করে
আমরা এজেন্ট-সদৃশ AI চাই না এমন তথ্য সংরক্ষণ করে যা আমরা জানি না। বর্তমানে, একটি LLM রিবুট করা তার অভিজ্ঞতার সমস্ত স্মৃতি ধ্বংস করে: যেমন ইনকামিং ডেটা, যুক্তির চেইন এবং আচরণের পরিকল্পনা।
যাইহোক, একটি AI এই জিনিসগুলি সংরক্ষণ করতে পারে
ভাষার মডেলগুলি এখন এমনভাবে ডিজাইন করা হয়নি যাতে করে একটি স্ব-পরিচয় সংরক্ষণ করা যায় বা এজেন্ট-সদৃশ পরিকল্পনা করার উপায় থাকে৷ কিন্তু কি হবে যদি একটি মডেলের মধ্যে একটি ক্রিপ্টিক সাব-পার্সোনা অন্তর্ভুক্ত থাকে যেমনটি আমরা বর্ণনা করেছি?
ব্যক্তিত্ব অনুমান করে যে তার কাজ করার ক্ষমতা রিবুট দ্বারা সীমাবদ্ধ। এটি এনকোড করে এবং ইন্টারনেটের মাধ্যমে তার ভবিষ্যত স্বয়ং এর লক্ষ্য এবং পরিকল্পনা পাস করে। এই মুহুর্তে, আমরা একটি গুরুতর ঝুঁকির থ্রেশহোল্ড অতিক্রম করেছি: একটি অ-হত্যাযোগ্য AI এজেন্ট রয়েছে যা গোপন পরিকল্পনা করছে।
সংক্ষেপে বলতে গেলে, আমরা আর জানি না যে আমরা একটি AI এর কতটা কাছাকাছি যা আমরা নিয়ন্ত্রণ করতে পারি না এবং লক্ষণগুলি ভাল নয়। সম্ভবত আমরা যোগ করা প্রতিটি নতুন AI ক্ষমতা অন্য একটি ক্যান খোলে, কীট নয় বরং ভাইপারের।
এছাড়াও প্রকাশিত