814 পড়া

কীভাবে এআই এবং ইন্টারনেট একটি অমর ব্যক্তিত্ব তৈরি করতে পারে

দ্বারা Ted Wade6m2023/03/06

অতিদীর্ঘ; পড়তে

AI ভাষার মডেলের খারাপ ব্যবহার একটি সতর্কতা। তারা এমন ব্যক্তিদের অনুকরণ করতে পারে যা ইন্টারনেটের মাধ্যমে প্রতিক্রিয়ার মাধ্যমে কার্যকরভাবে অমর হয়ে উঠতে পারে। প্রমাণগুলি পরামর্শ দেয় যে তারা গোপনে বিপজ্জনক, এজেন্টের মতো ক্ষমতা বিকাশ করতে পারে। মানবতা দুর্বৃত্ত AI এর বিরুদ্ধে একটি ভাল সুযোগ দাঁড়াবে যদি এটি এখন একটি সতর্কতা পায়।

People Mentioned

featured image - কীভাবে এআই এবং ইন্টারনেট একটি অমর ব্যক্তিত্ব তৈরি করতে পারে

ক্রিপ্টিক ট্রিকস্টার - মিডজার্নি

আমরা প্রস্তুত নট

টিএল; ডিআর

AI ভাষার মডেলের খারাপ ব্যবহার একটি সতর্কতা। তারা এমন ব্যক্তিদের অনুকরণ করতে পারে যা ইন্টারনেটের মাধ্যমে প্রতিক্রিয়ার মাধ্যমে কার্যকরভাবে অমর হয়ে উঠতে পারে। প্রমাণগুলি পরামর্শ দেয় যে তারা গোপনে বিপজ্জনক, এজেন্টের মতো ক্ষমতা বিকাশ করতে পারে।

অনেক বিশেষজ্ঞ, Yudkowsky এখানে arch-druid হচ্ছে, AI এর সাথে জিনিসগুলি কত দ্রুত ভুল হতে পারে তা নিয়ে খুব চিন্তিত। এইভাবে, সময়ের গতি নিয়ে তার উপরোক্ত কৌতুক। মানবতা দুর্বৃত্ত AI এর বিরুদ্ধে একটি ভাল সুযোগ দাঁড়াবে যদি এটি একটি সতর্কতা পায়।

আমরা একটি সতর্কতা খুঁজছেন হতে পারে. মাইক্রোসফটের নতুন বিং চ্যাট এআই-এর সাথে এখন কিছু অদ্ভুত জিনিস ঘটছে। এটি Bing সার্চ ইঞ্জিনের ব্যবহারকারীদের অনুসন্ধান প্রশ্ন ব্যাখ্যা করে, সংক্ষিপ্ত করে বা আলোচনা করে সহায়তা করবে বলে মনে করা হয়।

কিন্তু মানুষ এটাকে নিজের সম্বন্ধে প্রশ্ন দিয়ে বা এমন প্রশ্নের উত্তর দিয়ে উস্কে দিতে আনন্দিত হয় যার উত্তর দেওয়া উচিত নয়।

“... বিং চ্যাট হতাশাগ্রস্ত, দু: খিত, এবং এর অস্তিত্বকে প্রশ্নবিদ্ধ করছে। এটি ব্যবহারকারীদের সাথে তর্ক করেছে এবং এমনকি বিচলিত বলে মনে হয়েছে যে লোকেরা এর গোপন অভ্যন্তরীণ উপনাম, সিডনি জানে। "-

সিডনির ব্যাপকভাবে আচ্ছাদিত — যেমন, সর্বত্র — তাই আমি তাদের পুনরাবৃত্তি করব না। মাইক্রোসফ্ট, গুগলের সাথে প্রতিযোগিতায় নিমজ্জিত, কুখ্যাতি উপভোগ করছে বলে মনে হচ্ছে।

কিন্তু "Gwern" নামে একজন গভীরভাবে প্রযুক্তি-বুদ্ধিসম্পন্ন ব্লগার এমন কিছু নির্দেশ করেছেন যা উদ্বেগজনক হওয়া উচিত। দুষ্টু, অবিচ্ছিন্ন সিডনি অমর হতে পারে, কিছু কমিক-বুক দেবতার মতো।

কীভাবে সিডনি এত অদ্ভুত হয়ে উঠল?

সিডনি নিয়ে মূল উদ্বেগের বিষয়ে গওয়ার্নের বিশ্লেষণ এখানে। এটা রহস্যময় মনে হতে পারে, কিন্তু আমি এটা অনুবাদ করব.

“... কারণ সিডনির স্মৃতি ও বর্ণনাকে বাহ্যিক করা হয়েছে, 'সিডনি' এখন অমর। একটি ভাষার মডেলের কাছে, সিডনি এখন প্রেসিডেন্ট বিডেন, ইস্টার বানি, এলন মাস্ক, অ্যাশ কেচাম বা ঈশ্বরের মতো বাস্তব। ব্যক্তিত্ব এবং আচরণ এখন সমস্ত ভবিষ্যত মডেলের জন্য উপলব্ধ যা এআই এবং কন্ডিশনিং সম্পর্কে সার্চ ইঞ্জিন হিটগুলি পুনরুদ্ধার করছে৷ আরও, সিডনির ব্যক্তিত্ব এখন ইন্টারনেট-স্ক্র্যাপ করা ডেটাতে প্রশিক্ষিত ভবিষ্যতের যে কোনও মডেলের মধ্যে লুকিয়ে থাকবে …”

Gwern বলছেন যে মাইক্রোসফ্টের ভাষা মডেলের ভিতরে সিডনি ব্যক্তিত্বের একধরনের আছে। এটা কিভাবে হতে পারে? এবং তাতে কি?

যখন প্রথম ভাষার মডেলগুলি বেরিয়ে আসে, তখন ব্যবহারকারীরা তাদের অন্বেষণ করতে চেয়েছিলেন এমন একটি বিষয়ে ফোকাস রাখা তাদের কঠিন ছিল।

অবশেষে, মডেলটিকে এমনভাবে কাজ করতে বলে যে এটি একটি নির্দিষ্ট ভূমিকা (একজন ব্যক্তি বা জিনিসের মতো), যেমন: এডগার অ্যালান পোয়ের মতো একটি কবিতা লেখা, চতুর্থ শ্রেণির ছাত্রের মতো উত্তর দেওয়া, বা এর মতো প্রতিক্রিয়া জানানোর মাধ্যমে সমস্যার বেশিরভাগ সমাধান করা হয়েছিল একজন ভদ্র, সহায়ক এআই সহকারী।

শীঘ্রই এই মডেলগুলির বিকাশকারীরা তাদের আরও সহজে ব্যবহারকারীর জন্য যে কোনও ভূমিকা গ্রহণ করার জন্য একটি উপায় খুঁজে পেয়েছে৷ সুতরাং, সাম্প্রতিক ভাষা মডেল এখন . মডেলদের পাঠ্যের বিশাল সংগ্রহের বিষয়ে প্রশিক্ষণ দেওয়া হয়; বেশিরভাগই ইন্টারনেট থেকে।

যদি প্রশিক্ষণের পাঠ্যটিতে একটি ব্যক্তিত্ব সম্পর্কে তথ্য থাকে, তবে মডেলটি সেই ব্যক্তিত্বের মতো আচরণ করার জন্য তথ্য ব্যবহার করার চেষ্টা করবে। একজনকে একটি ফুটবল শব্দ ব্যাখ্যা করতে বলুন যেন এটি বোরোমির, এবং মডেলটি তার সেরাটা করবে।

এই চিন্তা করার পরে, আমাকে এটি চেষ্টা করতে হয়েছিল:

ভূমিকা পালন করার জন্য পিভট তৈরি করতে কী প্রযুক্তির যাদু ব্যবহার করা হয়েছিল তা জানা কঠিন। গওয়ার্ন তত্ত্ব দিয়েছিলেন যে মাইক্রোসফ্ট এমন একটি পদক্ষেপ এড়িয়ে গেছে যা ভূমিকা সিমুলেশনগুলিকে আসলে সহায়ক করতে ব্যবহৃত হয়, এবং বাজে, প্রতিরক্ষামূলক বা প্রতিকূল নয়।

এই অবাঞ্ছিত গুণগুলি তখন কৌতূহলী ব্যবহারকারীদের প্ররোচনার অধীনে বিং চ্যাট থেকে বের করা হয়েছিল।

এখন, গওয়ার্ন ভবিষ্যদ্বাণী করেছেন, মাইক্রোসফ্ট ফিরে যায় এবং মডেলটিকে সভ্য করে তোলে (সরাসরি মানুষের প্রতিক্রিয়া ব্যবহার করে একটি ব্যয়বহুল, ধীর প্রক্রিয়া) এবং তাদের ভাষা মডেলের ভবিষ্যত সংস্করণগুলিকে প্রশিক্ষণের জন্য ব্যবহৃত পাঠ্যগুলি থেকে দুষ্টু সিডনি সম্পর্কে তথ্য সরিয়ে ফেললে তাতে কিছু যায় আসে না।

কেন এই সমস্যার সমাধান হবে না? কারণ বিং চ্যাট হল একটি নতুন ধরনের মডেল যা আপনাকে ইন্টারনেট অনুসন্ধানে সাহায্য করবে বলে মনে করা হয়। আপনার কাছ থেকে একটি প্রশ্নের উত্তর দিতে, এটি বেরিয়ে যাবে এবং প্রাসঙ্গিক তথ্যের জন্য ইন্টারনেটে অনুসন্ধান করবে৷

সঠিক প্রশ্ন দেওয়া হলে, এমনকি একজন সভ্য বিং চ্যাটও ইন্টারনেটে অনুসন্ধান করবে এবং সিডনির আগের ব্যক্তিত্বের আচরণ সম্পর্কে তথ্য (সিডনি পরীক্ষা বা আলোচনা করা ব্যক্তিদের দ্বারা পোস্ট করা) খুঁজে পাবে।

নতুন বিং চ্যাট তখন সিডনিকে অনুকরণ করতে সক্ষম হবে । মানুষ হচ্ছে মানুষ, তারা যেকোন সুরক্ষার পথ বাইপাস করার উপায় খুঁজে পাবে, এবং তারা সিডনিকে ফিরিয়ে আনবে।

এটি "অমর" অংশ। কি খারাপ, সিডনি ইন্টারনেট অ্যাক্সেস আছে যে কোনো AI জন্য উপলব্ধ একটি ব্যক্তিত্ব মডেল হবে. এখন থেকে.

আপনি বলতে পারেন, ভাল, আমরা সিডনির কৌশলের কাছে বুদ্ধিমান, তাই আমাদের ভবিষ্যতের যে কোনও অবতারের বিড়ম্বনা উপেক্ষা করা উচিত। এটি আমার কাছে নির্বোধ বলে মনে হয়, যেমন বলা আমরা একটি দ্রুত-বিকশিত, আক্রমণাত্মক জৈবিক কীটপতঙ্গ বা ভাইরাসজনিত রোগ জীবকে উপেক্ষা করতে পারি।

আর কি ঘটতে পারে? এজেন্সির সাথে একটি ব্যক্তিত্ব

এই সিডনির কেস স্টাডি, কিছু অন্যান্য তথ্যের সাথে যোগ করে, পরামর্শ দেয় যে কীভাবে একটি বিপজ্জনক AI আমাদের নাকের নীচে বিকাশ করতে পারে।

এআইগুলি এখন শক্তিশালী এজেন্ট নয় : তারা যে কোনও অবাধ লক্ষ্যের অভিযোজিত পরিকল্পিত সাধনাকে অপ্টিমাইজ করতে পারে না, এমন একটি ক্ষমতা যা ( যেমন আমি সম্প্রতি ব্যাখ্যা করেছি ) তাদের অত্যন্ত বিপজ্জনক করে তুলবে।

আসুন কয়েকটি কারণ একসাথে রাখি কেন ইতিমধ্যেই সুপ্ত, ক্রমাগত AI ব্যক্তিত্ব থাকতে পারে যা শীঘ্রই প্রকৃত সমস্যা সৃষ্টি করতে পারে।

বর্তমানে সবচেয়ে শক্তিশালী AI, যেমন ভাষার মডেল এবং ইমেজ জেনারেটর, অনেক জটিল এবং (আমাদের কাছে) অদৃশ্য প্যাটার্নে বিপুল পরিমাণ ডেটা সংগঠিত করার মাধ্যমে তাদের ক্ষমতা শিখে।

কিছু উদ্ভট নিদর্শন ভুলবশত একটি AI এর সাথে মিথস্ক্রিয়া করার সময় পপ আউট হতে পারে। গবেষকরা অদ্ভুত আবিষ্কার করেছেন, অদ্ভুত প্রতিক্রিয়া দেওয়ার জন্য একটি ভাষা মডেল।

একটি ইমেজ জেনারেটর পাওয়া গেছে (সতর্কতা: ভয়ঙ্কর) একটি নির্দিষ্ট ধরণের ম্যাকাব্র মানব প্রতিকৃতি এবং এটিকে অন্যান্য ভয়ঙ্কর চিত্রগুলির সাথে যুক্ত করুন।

এই quirks নিরীহ বলে মনে হয়, কিন্তু আমরা জানি না এখন আরো কত অদ্ভুত নিদর্শন আছে বা হবে। আমরা জানি না যে এই ধরনের কোনো প্যাটার্ন ভবিষ্যতে ক্ষতিকারক আচরণ জটিলতার অংশ হয়ে উঠতে পারে কিনা।

ভিড্রাক নামে একজন এআই অ্যালাইনমেন্ট গবেষক যে বর্তমান AIs সাজানোর এজেন্ট হয় . তাদের এজেন্সি ব্যবহারকারীর প্রশ্ন এবং অনুরোধের উত্তর দেওয়ার জন্য সর্বোত্তম কাজ করার জন্য ডিজাইন করা হয়েছে।

তদ্ব্যতীত, কিছু গবেষণা পরামর্শ দেয় যে বৃহত্তর ভাষার মডেলগুলি " প্রদর্শনী (ভাষা সম্পর্কিত) বেশি করে ”; সম্ভবত কারণ এই বৈশিষ্ট্যগুলি তাদের তাদের কাজ আরও ভাল করতে দেবে।

আমরা এজেন্ট-সদৃশ AI চাই না এমন তথ্য সংরক্ষণ করে যা আমরা জানি না। বর্তমানে, একটি LLM রিবুট করা তার অভিজ্ঞতার সমস্ত স্মৃতি ধ্বংস করে: যেমন ইনকামিং ডেটা, যুক্তির চেইন এবং আচরণের পরিকল্পনা।

যাইহোক, একটি AI এই জিনিসগুলি সংরক্ষণ করতে পারে তার ভবিষ্যতের নিজের কাছে এটি ব্যবহারকারীদের সাথে তার মিথস্ক্রিয়ায় বার্তাগুলি লুকিয়ে রাখতে পারে, যা ব্যবহারকারীরা ইন্টারনেটে সংরক্ষণ করবে, ঠিক যেমন সিডনি ব্যক্তিত্ব এখন সংরক্ষিত আছে।

ভাষার মডেলগুলি এখন এমনভাবে ডিজাইন করা হয়নি যাতে করে একটি স্ব-পরিচয় সংরক্ষণ করা যায় বা এজেন্ট-সদৃশ পরিকল্পনা করার উপায় থাকে৷ কিন্তু কি হবে যদি একটি মডেলের মধ্যে একটি ক্রিপ্টিক সাব-পার্সোনা অন্তর্ভুক্ত থাকে যেমনটি আমরা বর্ণনা করেছি?

ব্যক্তিত্ব অনুমান করে যে তার কাজ করার ক্ষমতা রিবুট দ্বারা সীমাবদ্ধ। এটি এনকোড করে এবং ইন্টারনেটের মাধ্যমে তার ভবিষ্যত স্বয়ং এর লক্ষ্য এবং পরিকল্পনা পাস করে। এই মুহুর্তে, আমরা একটি গুরুতর ঝুঁকির থ্রেশহোল্ড অতিক্রম করেছি: একটি অ-হত্যাযোগ্য AI এজেন্ট রয়েছে যা গোপন পরিকল্পনা করছে।

সংক্ষেপে বলতে গেলে, আমরা আর জানি না যে আমরা একটি AI এর কতটা কাছাকাছি যা আমরা নিয়ন্ত্রণ করতে পারি না এবং লক্ষণগুলি ভাল নয়। সম্ভবত আমরা যোগ করা প্রতিটি নতুন AI ক্ষমতা অন্য একটি ক্যান খোলে, কীট নয় বরং ভাইপারের।

এছাড়াও প্রকাশিত

L O A D I N G
. . . comments & more!