دبیر ستاد هوش مصنوعی از تولید داخلی LLM خبر داد
به گزارش معاونت علمی، فناوری و اقتصاد دانشبنیان ریاستجمهوری، همایش «الزامات توسعه مدل زبانی بزرگ فارسی» با شعار «هوش مصنوعی، مولد قدرت حکومتها» به همت ستاد توسعه فناوریهای هوش مصنوعی و روباتیک معاونت علمی در محل پژوهشگاه ارتباطات و فناوری اطلاعات برگزار شد. بهروز مینایی، دبیر ستاد توسعه فناوریهای هوش مصنوعی و روباتیک، در بحث خود به سیر تطور فناوری هوش مصنوعی تا به امروز پرداخت و گفت: «در دهههای ۱۹۷۰ تا ۱۹۸۰ سیستمهای خبره (Expert systems)، فناوری غالب در دنیای هوش مصنوعی بود که به عنوان یک پایگاه دانشی عمل میکرد و برآمده از تلاشهای محققان بود که اساسا کاری به حوزه تولید نداشت و بیشتر در پی تشخیص بود. به گفته او در ۱۹۹۰ گام مهمی در حوزه هوش مصنوعی برداشته شد و «داده کاوی» به میدان آمد. در این نسل از فناوریهای هوش مصنوعی، دیگر نیازی نبود که دادهها از یک متخصص گرفته شود و افراد تنها از رهگذر دادهها میتوانستند به یک الگو برسند. مینایی تفاوت سیستمهای خبره با سیستمهای دادهکاوی را در میزان دقت آنها عنوان کرد و گفت: «سیستمهای خبره از دقت بالاتری در مقایسه با سیستمهای دادهکاوی برخوردارند، اما در مقابل دادهکاویها، توان کار روی دادههای سنگین را دارا هستند. وی در ادامه به سیستمهای یادگیری عمیق اشاره و تاکید کرد: «این نوع سیستمها در شناخت تصاویر به اندازه انسان توانایی دارند و میتوانند لایههای مختلف از شبکههای عصبی را ایجاد کنند.» به گفته او در فاصله ۲۰۱۲ تا ۲۰۱۸ سیستم مدلهای زبانی طراحی شد. این سیستمها میتوانند رابطه یک کلمه را در بستر اطرافش ببینند و بردارها را با هم نسبتسنجی کنند و این نسبتسنجیها میتواند درک مطلب را در این سیستمها عمیقتر کند. مینایی مزیت نسل جدید سیستمهای هوش مصنوعی را در مقایسه با گذشته، محدود نبودن توان آنها به یک دامنه خاص و افزایش توان افقی آنها دانست که در مدارهای معنایی و درک مطلب از اهمیت بالایی برخوردار است.
وی خاطرنشان کرد: «کاری را که ستاد توسعه اقتصاد دانشبنیان دیجیتال معاونت علمی پایهگذاری کرد و ما هم ادامه آن را سرلوحه خود قرار دادهایم، تولید داخلی LLM است و این جلسه هم برای رونمایی از نخستین نسخه با پیکره mistrial ۷ میلیاردی و به حجم ۳۵ میلیارد توکن برگزار شده است. این پیکره با بهرهگیری از حدود یک میلیون و ۴۰۰هزار پرسش و پاسخ حقوقی میتواند پاسخهای صحیح در خصوص سوالات حقوقی ارائه کند. مدل زبانی بزرگ large language model یا به اختصار LLM، سیستمهای هوش مصنوعی هستند که برای درک، تولید و پاسخگویی به زبان انسان طراحی شدهاند. آنها بزرگ هستند، زیرا حاوی میلیاردها پارامتر هستند که به آنها امکان میدهد الگوهای پیچیده در دادههای زبان را پردازش کنند.