IA generativa: ¿pueden protegerse los modelos de datos?
Cristina Mesa, socia de Propiedad Industrial e Intelectual de Garrigues
Los modelos de datos, que son el “cerebro” de los sistemas de inteligencia artificial, no son protegibles a través de la normativa de propiedad intelectual. En principio, tampoco serían patentables, pero sí cabría, quizás, protegerlos como secretos empresariales. Analizamos cuál es la situación en España.
En el proceso de adopción de los nuevos sistemas de inteligencia artificial (IA) generativa, el foco en materia de propiedad intelectual se ha estado poniendo en los contenidos utilizados para el entrenamiento (normalmente, accesibles en la web) y en si su uso no autorizado podría considerarse una infracción masiva de derechos de propiedad intelectual (ver nuestro post aquí). Sin restarle importancia a esta cuestión, hoy queremos centrarnos en otra distinta: la posibilidad de proteger los modelos de datos, el “cerebro” de estos sistemas.
En primer lugar, debemos tener en cuenta que, aunque la IA generativa utiliza en mayor o menor grado software, no se trata, ni mucho menos, de su elemento más valioso. Cuando hablamos de aprendizaje profundo, los modelos de datos y los datos de entrenamiento son normalmente más relevantes, quedando el código relegado a un segundo plano. Este cambio en la cadena de valor nos lleva a realizarnos nuevas preguntas sobre cómo proteger la inversión en el desarrollo de este tipo de sistemas, por un lado, y los resultados obtenidos con su uso, por otro. Vayamos por partes.
Un modelo de datos NO es una base de datos
El modelo de datos es el resultado del entrenamiento y afinamiento mediante el uso masivo de contenidos o datos). Actúa como el “cerebro” del sistema, y es lo que permite generar contenido de calidad. La clave para que el sistema sea eficaz está en la ingesta masiva de datos. Es esta ingesta la que permite que el modelo identifique y aprenda patrones y características de la información y, a partir de este aprendizaje, sea capaz de hacer predicciones, clasificaciones o generar nuevo contenido.
Recordemos que según la Directiva sobre la protección jurídica de las bases de datos (1996), las bases de datos son recopilaciones de datos dispuestos de forma sistemática y accesibles de forma individual. Si bien es cierto que los modelos de datos pueden alimentarse de bases de datos, no deben confundirse con ellas. Un modelo de datos no almacena la información de entrenamiento como tal, sino que conserva una representación abstracta de esa información. El modelo contiene un conjunto de pesos, parámetros y conexiones, pero no los datos originales en sí. Del mismo modo, cuando de niños aprendemos qué es un gato, no recordamos cada gato individual que hemos visto, sino una idea generalizada o concepto de “gato” basado en las características comunes que hemos observado a través de nuestra experiencia.
Por los mismos motivos tampoco resulta de aplicación la protección que confiere el derecho sui generis sobre bases de datos, que protege el esfuerzo inversor en la creación de la base de datos, desde un punto de vista cuantitativo y/o cualitativo. Es decir, este derecho sui generis se podría aplicar, en su caso, a los data sets que utilizamos para entrenar los sistemas de IA, ya que existen argumentos de peso para defender que hay una inversión en la compilación, incluyendo, como exige la normativa de propiedad intelectual, empleo de medios económicos, materiales y humanos en la obtención, verificación o la presentación de contenidos.
Los modelos de datos (generalmente) tampoco son patentables
La Ley de Patentes (2015) determina que para que una invención sea patentable debe cumplir con tres requisitos (i) novedad; (ii) actividad inventiva; y (iii) aplicación industrial. La práctica imposibilidad de patentar un modelo de datos se debe a dos factores principales. Por un lado, un modelo de datos puede definirse como un método matemático, una estructura o esquema que define cómo se organizan, almacenan y procesan los datos. Siendo así, estaría excluido de la protección ofrecida por la normativa de patentes que, recordemos, no considera invenciones los “descubrimientos, las teorías científicas y los métodos matemáticos”. A ello se une que los modelos de datos, en su forma pura, no tienen una aplicación concreta que resuelva un problema técnico y, por tanto, tampoco cumplirían con el requisito de “aplicación industrial”.
No obstante, sí es cierto que en el supuesto en que el modelo de datos forme parte de una solución técnica más amplia, que resuelve un problema específico, y siempre que cumpla con los requisitos de novedad y actividad inventiva, sí podría valorarse su patentabilidad.
Un modelo de datos SÍ podría ser un secreto empresarial
En ausencia de protección a través de la normativa de propiedad intelectual o industrial, cabe acudir, en mi opinión, a los secretos empresariales. La Ley de Secretos Empresariales (2019) se configura como una herramienta más que útil a la hora de proteger los activos realmente valiosos de las empresas intensivas en innovación digital que, cada vez más, se alejan de las líneas de código.
La definición de secretos empresariales que nos ofrece la norma es realmente amplia, y se extiende a cualquier información o conocimiento, incluido el tecnológico, científico, industrial, comercial, organizativo o financiero que (i) sea secreto; (ii) tenga valor comercial por ser secreto; y (iii) al que se le hayan aplicado medidas razonables para mantener su carácter secreto. Se trata, en definitiva, de la positivización e independencia normativa de los principios ya exigidos por la Organización Mundial del Comercio (OMC) a través de los Acuerdos sobre los Aspectos de los Derechos de Propiedad Intelectual relacionados con el Comercio, y aplicados por nuestros tribunales a través de la normativa de competencia desleal.
A modo de ejemplo, y aunque no hemos encontrado jurisprudencia que aborde la problemática concreta de los modelos de datos, sí resulta útil la relativa a la protección de los algoritmos como secretos empresariales. Ilustrando lo anterior, el auto núm. 229/2018 de 11 de diciembre del Juzgado de lo Mercantil núm. 4 de Barcelona en el que se reconoce la posibilidad de proteger los algoritmos como secretos empresariales.
En todo caso, la protección de los modelos de datos a través de la normativa de secretos empresariales tiene sus ventajas e inconvenientes, que podemos resumir como sigue:
Conclusión
El creciente valor de los modelos de datos en la IA basada en el aprendizaje profundo nos lleva a reflexionar sobre la posibilidad de obtener ventajas competitivas mediante su protección. La normativa de propiedad intelectual e industrial no parece facilitar la obtención de derechos de exclusiva, pero sí cabría, en principio, proteger los modelos de datos como secretos empresariales. Ahora bien, debe tratarse, en efecto, de modelos que tengan un valor económico por ser secretos y debemos, además, ser capaces de acreditar que hemos empleados medidas razonables para mantener la confidencialidad. Toca repensar las políticas de protección de secretos empresariales que empleamos en nuestras empresas, incluyendo la revisión de las cláusulas de empleados, proveedores y otros terceros, medidas de seguridad y formas de comercialización.