Muchos consideran que Copilot es principalmente un motor para violar las licencias de código abierto.
Se dio a conocer la noticia de que Matthew Butterick, un desarrollador de código abierto y el bufete de abogados Joseph Saveri presentaron una demanda contra los proveedores de tecnología utilizados en el servicio GitHub Copilot.
La demanda incluye a Microsoft, GitHub y las empresas detrás del proyecto OpenAI, que produjo el modelo de generación de código OpenAI Codex que sustenta a GitHub Copilot.
Durante el proceso, se intentó involucrar al tribunal en la determinación de la legalidad de la creación de servicios como GitHub Copilot y en averiguar si dichos servicios violan los derechos de otros desarrolladores.
La actividad de los acusados se compara con la creación de un nuevo tipo de software basada en la manipulación del código existente utilizando métodos de aprendizaje automático y que permite beneficiarse del trabajo de otras personas.
La creación de Copilot también se considera la introducción de un nuevo mecanismo para monetizar el trabajo de los desarrolladores de código abierto, a pesar de que GitHub prometió anteriormente no hacerlo nunca.
La posición de los demandantes se reduce al hecho de que el resultado de la generación de código por un sistema de aprendizaje automático entrenado en textos fuente disponibles públicamente no puede interpretarse como un trabajo fundamentalmente nuevo e independiente, ya que es una consecuencia del procesamiento del código existente por algoritmos.
Según los demandantes, Copilot solo reproduce código que tiene referencias directas a código existente en repositorios abiertos, y tales manipulaciones no se incluyen en los criterios de uso justo. En otras palabras, la síntesis de código en GitHub Copilot es considerada por los demandantes como la creación de un trabajo derivado del código existente distribuido bajo ciertas licencias y con autores específicos.
En particular, cuando se entrena el sistema Copilot, se utiliza código que se distribuye bajo licencias abiertas, en la mayoría de los casos requiriendo un aviso de autoría (atribución). Al generar el código resultante, este requisito no se cumple, lo que es una clara violación de la mayoría de las licencias abiertas, como GPL, MIT y Apache.
Además, Copilot viola los propios términos de servicio y privacidad de GitHub, no cumple con la DMCA, que prohíbe la eliminación de información de derechos de autor, y la CCPA (California Consumer Privacy Act), que regula el tratamiento de datos personales.
El texto de la demanda proporciona un cálculo aproximado del daño causado a la comunidad como resultado de las actividades de Copilot. Según la Sección 1202 de la Ley de derechos de autor del milenio digital (DMCA), los daños mínimos son de $2500 por infracción. Dado que el servicio de Copilot tiene 1,2 millones de usuarios y hay tres violaciones de DMCA (atribución, derechos de autor y términos de licencia) por cada uso del servicio, el daño total mínimo se estima en 9 mil millones de dólares.
The Software Freedom Conservancy (SFC), una organización de derechos humanos que ha criticado previamente a GitHub y Copilot , comentó la demanda recomienda que en la protección de los intereses de la comunidad no se desvíe de uno de los principios formulados anteriormente: «la aplicación de la ley orientada a la comunidad no debe dar prioridad a la ganancia financiera».
Según la SFC, las acciones de Copilot son inaceptables principalmente porque socavan el mecanismo «copyleft» destinado a brindar igualdad de derechos a usuarios, desarrolladores y consumidores. Muchos de los proyectos cubiertos en Copilot se suministran bajo licencias copyleft, como la GPL, que requiere que el código de obras derivadas se suministre bajo una licencia compatible. Pegar el código existente proporcionado por Copilot puede infringir involuntariamente la licencia del proyecto del que se tomó prestado el código.
Finalmente, cabe mencionar que días antes de la presentación de la demanda, GitHub anunció su intención de implementar una función en 2023 que permita rastrear la relación de los fragmentos generados en Copilot con el código existente en los repositorios. Los desarrolladores podrán ver una lista de códigos similares ya presentes en repositorios públicos, así como ordenar las intersecciones por licencias de código y cuándo se realizó el cambio.
Finalmente si estás interesado en poder conocer más al respecto, puedes consultar los detalles en el siguiente enlace.
Continúar leyendo...