Apropiación de Contenido por Scraping: Aspectos Legales en Argentina

La copia automatizada de contenido web mediante scraping constituye una infracción a la Ley 11.723 de Propiedad Intelectual, con sus respectivas consecuencias.

El Espejismo Digital: ‘Si está online, es de todos’

Hay una creencia popular, tan extendida como equivocada, de que el material publicado en internet pertenece a una especie de limbo de propiedad comunal. Es una idea reconfortante, sobre todo para quien busca construir un imperio digital sobre cimientos ajenos. La realidad, sin embargo, es mucho más tediosa y está escrita en el Boletín Oficial. La Ley 11.723 de Propiedad Intelectual no hace distinciones entre una novela impresa y un artículo publicado en un blog. Ambos son, a los ojos de la ley, ‘obras’, y como tales, confieren a su autor un conjunto de derechos morales y patrimoniales desde el mismo instante de su creación.

Que una obra sea de acceso público no significa que sea de dominio público. Subir un auto a la vereda no autoriza a cualquiera a llevárselo. Del mismo modo, publicar un texto en la web no es una invitación abierta a su reproducción indiscriminada. El ‘scraping’ —el acto de usar un programa o script para extraer sistemáticamente contenido de un sitio web— es, en su esencia, un acto de reproducción. La ley no se detiene a analizar la sofisticación del método. Le da igual si la copia se hizo con un bolígrafo, una fotocopiadora o un script de Python. El resultado es el mismo: una copia no autorizada de una obra protegida.

La protección nace con la obra misma. La inscripción en la Dirección Nacional del Derecho de Autor (DNDA) no es constitutiva del derecho, sino declarativa. Es una herramienta probatoria de un poder inmenso, que simplifica una barbaridad cualquier futuro reclamo, pero su ausencia no deja al autor en la intemperie legal. Demostrar la autoría por otros medios es más engorroso, sí, pero perfectamente posible. Por lo tanto, el argumento de ‘no estaba registrado’ es una defensa con la misma solidez que un castillo de naipes en medio de una corriente de aire.

La Mecánica del Delito (y sus Defensas Creativas)

Analicemos el proceso desde la butaca del espectador cínico. Por un lado, tenemos al creador original, que invirtió tiempo, conocimiento y recursos en generar un contenido. Por otro, al ‘emprendedor’ que, con una herramienta automatizada, ‘cosecha’ ese contenido para poblar su propio sitio, usualmente con fines comerciales. El scraper no es un hacker que vulnera sistemas de seguridad; es más bien un coleccionista obsesivo que entra a la casa por la puerta principal y se lleva los muebles a la vista de todos, pero muy, muy rápido.

Para quien acusa, el camino es claro, aunque no siempre sencillo. El primer paso es la constatación de la infracción. Esto se logra con actas notariales, capturas de pantalla certificadas o servicios de archivo web que demuestren la existencia de la copia literal en el sitio del infractor. El segundo paso suele ser el envío de una carta documento, ese clásico del folklore legal argentino, intimando al cese del uso y a una posible reparación económica. Si la cordialidad epistolar no funciona, se abre la puerta a una mediación prejudicial y, eventualmente, a un juicio por daños y perjuicios, reclamando tanto el daño emergente como el lucro cesante.

Revelaciones Incómodas para el Acusado

Quien se encuentra del otro lado del mostrador suele esgrimir una serie de argumentos que, a fuerza de repetición, han adquirido un estatus casi mítico. Es un deber profesional desmantelarlos uno por uno.

‘No sabía que era ilegal’: El desconocimiento de la ley no exime de su cumplimiento. Es el principio más básico del derecho y, curiosamente, el más invocado. Apelar a la propia ignorancia como escudo es, legalmente, inútil.

‘Solo tomé una parte pequeña’: La ley de propiedad intelectual no opera con una lógica de ‘un poquito no es robo’. Si bien el ‘derecho de cita’ (art. 10 de la Ley 11.723) permite la transcripción de hasta mil palabras con fines críticos, educativos o científicos y siempre citando la fuente, el scraping de artículos enteros o bases de datos no encaja en esta excepción. Es una apropiación sistemática, no una cita académica.

‘Pero le di crédito’: Atribuir la fuente no es una licencia para copiar. Es un gesto de cortesía, si se quiere, pero no subsana la falta de autorización. Es como usar el auto del vecino sin permiso y dejarle una nota de agradecimiento en el parabrisas. El vecino sigue teniendo todo el derecho a iniciar un reclamo.

‘Mi robot lo hizo solo’: La personificación de un software como entidad autónoma y responsable es una fantasía de ciencia ficción. Quien crea, configura y ejecuta un script es el único responsable de sus acciones. La herramienta no tiene voluntad propia; el que la maneja, sí.

Estrategias de Supervivencia en la Jungla Digital

Ante este panorama, la prevención y la estrategia son claves. No se trata de tener miedo a la tecnología, sino de entender sus implicancias legales.

Para el creador de contenido (La Víctima Designada):

Términos y Condiciones: Incluir una cláusula que prohíba expresamente la reproducción y el scraping de contenido es fundamental. Si bien no detendrá al infractor decidido, fortalece notablemente la posición legal en un eventual litigio.
Barreras Técnicas: Utilizar un archivo robots.txt para indicar a los bots de rastreo que no indexen ciertas partes del sitio es una buena práctica. Herramientas como CAPTCHAs o límites de peticiones por IP pueden disuadir a los scrapers menos sofisticados. Son medidas de disuasión, no murallas infranqueables.
Registro de Obras: La recomendación más importante. Registrar las obras clave en la DNDA es una inversión mínima que otorga una fecha cierta de publicación y simplifica la prueba de titularidad de una manera abrumadora. Es el equivalente a tener la escritura de la casa en lugar de un boleto de compraventa informal.
Monitoreo y Acción: Usar alertas para detectar copias del contenido y, ante la primera infracción, actuar con celeridad. La inacción puede ser interpretada, erróneamente, como consentimiento tácito.

Para el ‘Curador’ de Contenido (El Potencial Infractor):

La Solución Mágica: Pedir Permiso. Suena revolucionario, pero obtener una licencia o un acuerdo explícito del titular de los derechos es la única forma 100% segura de utilizar contenido ajeno. Muchos creadores están abiertos a sindicar su contenido o a colaborar si se les presenta una propuesta seria.
Utilizar APIs: Muchos sitios ofrecen Interfaces de Programación de Aplicaciones (APIs) para acceder a sus datos de forma controlada y legítima. Usar una API es usar la puerta de servicio que el dueño dejó abierta, en lugar de forzar la principal.
Enfocarse en Datos, no en Obras: Hay una delgada línea. Scrapear datos puros y no protegidos (como precios de productos para un comparador) tiene un riesgo menor que scrapear obras creativas (artículos, fotos, reseñas). Aun así, es una zona gris que depende de los términos de servicio del sitio fuente.

En definitiva, la creencia de que el código otorga una especie de inmunidad legal es el origen de una pila de problemas. La ley, con su ritmo analógico, siempre termina por alcanzar a la velocidad digital. Y cuando lo hace, la cuenta suele ser más cara que el costo de haber hecho las cosas bien desde el principio.