Why AI fails to reproduce human vision

টরন্টো: যদিও কম্পিউটারগুলি মানুষের মস্তিষ্কের তুলনায় একটি পরিচিত মুখ বা একটি আগত গাড়িকে দ্রুত সনাক্ত করতে সক্ষম হতে পারে, তবে তাদের নির্ভুলতা প্রশ্নবিদ্ধ।

কৃত্রিম বুদ্ধিমত্তা (AI) ব্যবহার করে মুখ এবং গাড়ির পর্যবেক্ষণের মতো ইনকামিং ডেটা প্রক্রিয়া করতে কম্পিউটার শেখানো যেতে পারে যা গভীর নিউরাল নেটওয়ার্ক বা গভীর শিক্ষা হিসাবে পরিচিত। এই ধরনের মেশিন লার্নিং প্রক্রিয়া মানুষের মস্তিষ্কের অনুরূপ স্তরযুক্ত কাঠামোতে আন্তঃসংযুক্ত নোড বা নিউরন ব্যবহার করে।

মূল শব্দটি হল কম্পিউটারের মতো “সাদৃশ্য”, গভীর শিক্ষার ক্ষমতা এবং প্রতিশ্রুতি সত্ত্বেও, এখনও মানুষের গণনা আয়ত্ত করতে পারেনি এবং গুরুত্বপূর্ণভাবে, শরীর এবং মস্তিষ্কের মধ্যে যোগাযোগ এবং সংযোগ পাওয়া যায়, বিশেষ করে যখন এটি দৃশ্যমান স্বীকৃতির ক্ষেত্রে আসে। কানাডার ওয়েস্টার্ন ইউনিভার্সিটির নিউরোইমেজিং বিশেষজ্ঞ মেরিকে মুরের নেতৃত্বে একটি গবেষণা।

“প্রতিশ্রুতিবদ্ধ হলেও, গভীর নিউরাল নেটওয়ার্কগুলি মানুষের দৃষ্টিভঙ্গির নিখুঁত কম্পিউটেশনাল মডেল থেকে অনেক দূরে,” মুর বলেছেন।

পূর্ববর্তী গবেষণায় দেখা গেছে যে গভীর শিক্ষা নিখুঁতভাবে মানুষের ভিজ্যুয়াল স্বীকৃতিকে পুনরুত্পাদন করতে পারে না, তবে খুব কম লোকই মানব দৃষ্টি গভীর শিক্ষার কোন দিকগুলি অনুকরণ করতে ব্যর্থ হয় তা প্রতিষ্ঠিত করার চেষ্টা করেছে।

দলটি ম্যাগনেটোএনসেফালোগ্রাফি (এমইজি) নামে একটি অ-আক্রমণকারী মেডিকেল পরীক্ষা ব্যবহার করেছে যা মস্তিষ্কের বৈদ্যুতিক স্রোত দ্বারা উত্পাদিত চৌম্বকীয় ক্ষেত্রগুলি পরিমাপ করে। বস্তু দেখার সময় মানব পর্যবেক্ষকদের কাছ থেকে অর্জিত MEG ডেটা ব্যবহার করে, মুর এবং তার দল ব্যর্থতার একটি মূল বিষয় সনাক্ত করেছে।

তারা দেখেছে যে “চোখ,” “চাকা” এবং “মুখ” এর মতো বস্তুর সহজেই নামকরণযোগ্য অংশগুলি গভীর শিক্ষা প্রদান করতে পারে তার উপরে এবং তার উপরে মানুষের স্নায়ু গতিবিদ্যার পার্থক্যের জন্য দায়ী।

“এই ফলাফলগুলি পরামর্শ দেয় যে গভীর নিউরাল নেটওয়ার্ক এবং মানুষ আংশিকভাবে চাক্ষুষ স্বীকৃতির জন্য বিভিন্ন বস্তুর বৈশিষ্ট্যগুলির উপর নির্ভর করতে পারে এবং মডেলের উন্নতির জন্য নির্দেশিকা প্রদান করতে পারে,” মুর বলেছেন।

সমীক্ষাটি দেখায় যে গভীর নিউরাল নেটওয়ার্কগুলি মানব পর্যবেক্ষকদের মধ্যে পরিমাপ করা স্নায়ু প্রতিক্রিয়াগুলির জন্য সম্পূর্ণরূপে অ্যাকাউন্ট করতে পারে না যখন ব্যক্তিরা মুখ এবং প্রাণী সহ বস্তুর ফটোগুলি দেখছেন এবং বাস্তব-বিশ্বের সেটিংসে গভীর শিক্ষার মডেলগুলির ব্যবহারের জন্য প্রধান প্রভাব রয়েছে, যেমন স্ব- যানবাহন চালানো

“এই আবিষ্কারটি ইমেজগুলিতে নিউরাল নেটওয়ার্কগুলি কী বুঝতে ব্যর্থ হচ্ছে সে সম্পর্কে সূত্র সরবরাহ করে, যেমন ভিজ্যুয়াল বৈশিষ্ট্য যা মুখ এবং প্রাণীর মতো পরিবেশগতভাবে প্রাসঙ্গিক বস্তুর বিভাগগুলির নির্দেশক,” মুর বলেছেন।

“আমরা পরামর্শ দিই যে নিউরাল নেটওয়ার্কগুলিকে আরও মানুষের মতো শেখার অভিজ্ঞতা দিয়ে মস্তিষ্কের মডেল হিসাবে উন্নত করা যেতে পারে, যেমন একটি প্রশিক্ষণ ব্যবস্থা যা মানুষের বিকাশের সময় আচরণগত চাপের উপর জোর দেয়।”

উদাহরণস্বরূপ, মানুষের পক্ষে দ্রুত সনাক্ত করা গুরুত্বপূর্ণ যে একটি বস্তু একটি নিকটবর্তী প্রাণী কিনা এবং যদি তাই হয়, তার পরবর্তী পরিণতিমূলক পদক্ষেপের পূর্বাভাস দেওয়া। প্রশিক্ষণের সময় এই চাপগুলিকে একীভূত করা মানুষের দৃষ্টিভঙ্গি মডেল করার জন্য গভীর শিক্ষার পদ্ধতির ক্ষমতাকে উপকৃত করতে পারে।

কাজটি নিউরোসায়েন্স জার্নালে প্রকাশিত হয়েছে।

Leave a Reply

Your email address will not be published. Required fields are marked *