از محتوای وب میتوان برای آموزش هوش مصنوعی منفعت برد_مستطیل زرد

نوشته و ویرایش شده توسط مجله ی مستطیل زرد
یکی از بزرگترین او گفت و گوها در دنیای هوش مصنوعی مولد این است که شرکتهایی که این مدلها را آموزش خواهند داد امکان پذیر از دادههای تحت کپیرایت در وب منفعت گیری کنند. تا بحال نیز این کار تبدیل شکایتهای بسیاری علیه شرکتهای هوش مصنوعی مولد، ازجمله مایکروسافت و OpenAI شده است. اکنون «مصطفی سلیمان»، مدیر ارشد هوش مصنوعی مایکروسافت آشکارا میگوید هر فردی میتواند از این دادهها منفعت ببرد.
مصطفی سلیمان بهتازگی با «اندرو راس سورکین» از CNBC مصاحبه کرده و در آن به یکی از پرحاشیهترین او گفت و گوهای آموزش هوش مصنوعی مولد پرداخته است. در قسمتی از این مصاحبه مصطفی سلیمان درمورد منفعت گیری آزادانه از دادههای حاضر در وب میگوید:
«قرارداد اجتماعی محتواها از دهه ۹۰ این بوده است که میتوان از محتوایی که در وب باز وجود دارد، منفعت گیری منصفانه کرد. هر فردی میتواند آن را کپی، بازسازی یا بازتولید کند. این [محتوا] رایگانافزار (Freeware) بوده است.»
نظرات مصطفی سلیمان درمورد آموزش هوش مصنوعی
مصطفی سلیمان این چنین درمورد محتواهایی که ناشر اجازه منفعت گیری از آنها را نداده، سخن بگویید کرد. او میگوید که علاوهبر محتواهای باز حاضر در وب، یک دستهبندی جداگانه نیز وجود دارد که در آن یک وبسایت، ناشر یا سازمان خبری به صراحت حرف های است که به هر دلیلی از ایندکسکردن و استخراج مطالب خودداری بشود. بهزعم مصطفی سلیمان این دستهبندی خاکستری است و به گمان زیادً منفعت گیری از آن میتواند به دادگاه منتهی بشود.
به نظر میرسد جواب سلیمان مشخص می کند که مایکروسافت و احتمالا دیگر شرکتهای مولد هوش مصنوعی، اعتقاد دارند تقریباً از همه چیز در اینترنت میتوان برای آموزش مدلهای آنها منفعت گیری کرد و آن شرکتها ناچار نیستند به سازندگان آن محتوا پولی بدهند. این مشاجره به گمان زیادً علتمیبشود که در ماهها و سالهای آینده مسائل حقوقی بیشتری نقل بشود.
مطابق گزارش هفته قبل، استارتاپ TollBit میگوید که چند شرکت هوش مصنوعی انگارً پروتکل امنیتی سایتها را که برای جلوگیری از استخراج مطالب آنها منفعت گیری میبشود، نادیده میگیرند. به نظر میرسد دو شرکت بزرگ OpenAI و Anthropic نیز این پروتکلها را دور میزنند.
دسته بندی مطالب