Чья это линия, GitHub? Несколько советов разработчикам

Чья это линия, GitHub? Несколько советов разработчикам

Чья это линия, GitHub? Несколько советов для разработчиков PlatoBlockchain Data Intelligence. Вертикальный поиск. Ай.

Обзор Открытый источник. Открыто. Вы можете посмотреть. В основном можно использовать. В названии есть подсказка. Не так быстро, утверждает коллективный иск против Microsoft, OpenAI и GitHub. Copilot, встроенный в IDE искусственный интеллект и обученный бот для предложений с открытым исходным кодом, работает, предлагая строки кода программистам — и это, как утверждает групповой иск, нарушает правила и пытается скрыть это. Судья постановил, что некоторые претензии заслуживают рассмотрения в суде. Господи, только не очередная битва за авторские права.

Технологии могут показаться судьям очень странными. Допустим, вы легально покупаете электронную книгу. Как вы его получите? Маршрутизаторы и серверы кэширования делают копии книги по мере ее доставки, но они не заплатили ни копейки. Владельцы интернет-инфраструктуры нарушают авторские права миллиарды раз в день? Вы можете подумать, что это глупый вопрос, но он настолько обеспокоил Верховный суд Великобритании, что отправился в Европу, чтобы спросить:Этот интернет вообще легальный??» Не будь таким чертовски глупым, последовал ответ. Мы скучаем по Европе.

Сколько претензий к Microsoft, Copilot и суфлеру кода OpenAI попадут в чертову коробку для дураков, еще неизвестно. Никто не предполагал, что ИИ будет использовать глобальные базы данных с открытым исходным кодом, когда писались правила. С другой стороны, никто не предвидел, что поисковые системы будут массово поглощать, анализировать и представлять весь контент. Это, безусловно, имеет свои проблемы, но все согласны с тем, что это слишком полезно и недостаточно вредно, чтобы объявить его вне закона. Copilot и другие системы машинного обучения, использующие интернет-контент, в этом отношении очень похожи на поисковые системы. Итак, вопрос в том, является ли результат недостаточно полезным или слишком разрушительным, чтобы его можно было принять? Где баланс интересов?

Есть полезные способы решения проблем, и они включают в себя – корпоративное руководство отвернется – этику. Да, действительно, эта краткая модная болтовня об этичном ИИ предлагает конкретный путь вперед, который будет работать намного лучше, чем судебные иски.

Суть закона об интеллектуальной собственности, искаженного особыми интересами, заключается в том, что следует уважать разумные желания создателя. Если программное обеспечение имеет открытый исходный код, то его создатель разумно желает, чтобы люди могли его прочитать и использовать. То, что поощряет это, не кажется худшим грехом в мире.

Возможно, это то, как он это делает, представляя предложения по коду вне контекста. В конце концов, существует множество лицензий с открытым исходным кодом, и некоторые из них могут содержать условия, о которых должен знать наш счастливый второй пилот. Ну, если предположить, что Copilot может распознать, когда он предлагает чужой код, вполне разумно, что он может сообщить об условиях лицензирования, на которых он предлагается. Это возлагает на программиста обязанность соблюдать требования, что более этично, чем предлагать искушение, скрывая последствия. Может даже повысить процент попаданий за соблюдение правил с открытым исходным кодом.

Что, если первоначальный кодер действительно не хочет, чтобы его материал выжимался из недр Copilot? Мир поисковых систем решил эту проблему, изобретя robots.txt. Поместите файл с таким именем в корневой каталог вашего веб-сайта, и вы поставите знак «Вход запрещен» для поисковых роботов. В наши дни все стало немного более продвинутым, поэтому было бы неплохо добавить такую ​​​​функцию в ткань GitHub с любой тонкой настройкой, которая лучше всего выражает намерение создателя. В любом случае, говоря контент-провайдерам: «Вы не хотите, чтобы ваши материалы попадали в наши результаты поиска? Отлично." имеет тенденцию сосредотачивать умы на том, как с этим жить. Давать людям выбор, объясняя последствия? Хороший.

Даже если предоставление людям права удалять свой код из Copilot и тому подобного приведет к тому, что уйдет куча хороших вещей, это не конец света. Есть «принцип чистой комнаты», который разрушил доминирующее положение IBM в 1980-х годах, одновременно ускорив рынок до безумия. Это то, из чего машинное обучение может многому научиться.

Исходный IBM PC был почти полностью с открытым исходным кодом. IBM опубликовала техническое руководство с полными принципиальными схемами, в которых использовались стандартные микросхемы, соединенные вместе стандартными способами, которые производители микросхем раздавали бесплатно. Разработка функционально эквивалентного (но не защищенного авторскими правами) клона IBM PC была тем, что могли сделать тысячи инженеров-электронщиков, и сотни сделали это.

Юридической миной в бежевой коробке был BIOS, базовая система ввода-вывода, относительно небольшой кусок постоянного программного обеспечения, который предоставлял стандартный набор аппаратных услуг операционным системам и приложениям через прерывания — то, что сегодня назвали бы API. Если бы вы просто скопировали этот код для своего клона, IBM заставила бы вас все исправить. Вы можете переписать код, но тогда IBM может затянуть вас в судебные иски, заставив вас доказать, что вы ничего не копировали. Даже если вы выиграете, задержка и расходы потопят вас.

Cue чистой комнате. Клонеры наняли программистов, которые никогда не читали ни строчки в BIOS IBM, и запретили им это делать. Этим программистам дали API, на который не распространялось авторское право, и сказали писать в соответствии с этой спецификацией. С юридическими свидетельствами клонеры были счастливы поклясться в суде, принцип, что вы не можете копировать то, что вы не видели, оставался в силе — и последняя часть головоломки в оригинальных Войнах клонов была на месте. То, что API-интерфейсы представляют собой такое мощное противоядие от авторских прав, побудило многих попытаться изменить свой правовой статус, совсем недавно Google против Oracle. Это закончилось в Верховном суде США, где оно, как и все остальные, потерпело неудачу.

Итак, возьмем две автоматизированные системы, одна предназначена для поиска и изоляции интерфейсов в коде, а другая предназначена для применения правил для генерации кода, обеспечивающего эти интерфейсы. Нет передачи строк кода через виртуальный воздушный зазор. Автоматическое тестирование исходного кода по сравнению с кодом ИИ повысит качество. Между прочим, появится очень хороший набор инструментов для рефакторинга, который пойдет на пользу всем. Звучит этично, правда?

Вот оно. Если есть настоящие проблемы с тем, что делает Copilot, то есть несколько способов избежать их, сохранив при этом полезность и создав новые преимущества. Играть по правилам, улучшая ситуацию? Это хорошая линия. ®

Отметка времени:

Больше от Регистр