Documento Institucional

Libro Blanco — Liberitas
y el Sello Liberitas

Análisis automatizado de IA y certificación criptográfica de originalidad para textos en español. Documento técnico-institucional dirigido a editoriales, universidades, prensa y partners B2B. Edición v1.1 con la validación pública ampliada a cohortes de humanidades, literatura clásica, ciencia básica y manuscritos académicos largos sobre cuatro repositorios institucionales.

Versión
1.2 — Edición pública
Publicación
29 mayo 2026
Lengua
Español
Páginas
13 secciones
Sección 01

Resumen Ejecutivo

La irrupción masiva de los grandes modelos de lenguaje (LLMs) en los últimos años ha alterado de forma estructural la cadena de valor de la edición literaria y de la evaluación académica. Texto generado por máquina, indistinguible para un lector humano no entrenado, convive con texto genuinamente humano en flujos editoriales, tesis universitarias, opiniones jurídicas y reportajes periodísticos.

El daño reputacional y legal de no poder distinguir uno de otro es asimétrico: un humano acusado falsamente de usar IA pierde una obra, un autor o una nota; una IA confundida con un humano contamina un catálogo, un repositorio universitario o un archivo público.

Dos principios rectores

Liberitas es un sistema de detección de IA en español de grado de producción, diseñado en torno a dos principios rectores:

Cero falsos positivos en literatura

Para una editorial, marcar a un autor humano como IA es un fallo catastrófico. Calibramos el sistema para que el FPR sobre literatura humana de control caiga a niveles residuales.

Trazabilidad criptográfica

Cada decisión queda firmada en un registro inmutable. Años después se puede reconstruir qué análisis produjo qué veredicto sobre qué texto exacto.

El programa Sello Liberitas opera sobre ese motor para emitir certificaciones editoriales públicamente verificables ("Obra sin IA Detectada") asociadas al hash criptográfico SHA-256 del manuscrito original.

Resultados observados sobre cohortes de validación

Nota metodológica. Las cifras siguientes corresponden a resultados observados sobre una cohorte de 1.400 manuscritos públicos nunca vistos por el sistema (922 humanos recogidos de repositorios institucionales españoles + 478 generados por cinco modelos de lenguaje comerciales, incluyendo uno nunca presente en el corpus de entrenamiento). El filtrado anti-leakage por identificador documental es reproducible. Las cifras son representativas pero no constituyen garantía contractual de rendimiento sobre cualquier manuscrito futuro: el comportamiento real depende del tipo de texto, su longitud, su género y el estado del arte de los modelos generativos en cada momento.

100 %
NPV (valor predictivo negativo)
0 %
FPR sobre cohorte humana (922 docs)
100 %
Recall sobre cohorte IA (478 docs, 5 LLMs)
100 %
Accuracy sobre decisiones firmes

Liberitas combina (a) modelos fundacionales nativos en español desarrollados por instituciones públicas españolas, (b) un ensemble neuronal con múltiples capas de veto, (c) calibración estadística por longitud y por género literario, y (d) un registro criptográfico trazable y reproducible.

Sección 02

Contexto y Problema

El cambio de paradigma

En los últimos años, la generación de texto por LLMs ha pasado de artefacto detectable a oficio especializado. Tres dinámicas han desactivado la mayor parte de los detectores de primera generación:

  • Humanización adversarial. Herramientas que reescriben la salida de un LLM para que pierda los marcadores estilísticos típicos.
  • Modelos multilingües más grandes. Producen castellano fluido que ya no comparte la "huella" de los detectores anglocéntricos entrenados sobre modelos antiguos en inglés.
  • Edición humana parcial. El caso más frecuente es un texto parcialmente IA con intervención humana posterior. Cualquier detector que tome una decisión binaria sobre la obra completa fracasa cuando una parte es IA y otra no.

Asimetría de costes para una editorial

Para una editorial, los dos tipos de error tienen consecuencias muy distintas:

Error Coste
Falso Positivo
humano marcado como IA
Catastrófico: ruptura con el autor, daño reputacional, riesgo legal.
Falso Negativo
IA marcada como humano
Asumible si está acotado: corrección posterior, revocación pública.

Esta asimetría justifica que el sistema esté deliberadamente sesgado a no certificar en caso de duda.

Asimetría de costes para una universidad

En el flujo universitario la asimetría es la opuesta: el coste de no detectar un TFG generado con IA es mayor que el coste de pedir una revisión humana sobre un caso dudoso. Por eso el sistema expone dos modos operativos con criterios distintos: uno de alta sensibilidad para uso académico y otro de alta especificidad para emisión de sello.

Sección 03

Solución: Liberitas y el Sello Liberitas

Liberitas (motor)

Liberitas es un motor de detección que combina varias capas complementarias:

  • Análisis neuronal con modelos nativos en español, fine-tuneados específicamente para detección de IA frente a corpus humano de referencia.
  • Detectores de patrones lingüísticos sobre fenómenos documentados que distinguen escritura humana de escritura generada (tipografía, vocabulario, retórica, estructura, hedging, caracteres invisibles, anomalías de lengua, densidad formal).
  • Análisis estadístico del texto (variabilidad de longitud de frases, diversidad léxica, uniformidad sintáctica).
  • Inspector de metadatos de PDF y DOCX (autor declarado, herramienta de creación, fechas de producción).
  • Calibración estadística por longitud y por género para que el comportamiento del sistema sea fiable en contextos muy distintos.
  • Decisión tri-estado: humano / inconcluso / IA. El estado intermedio existe precisamente para no forzar decisiones en zona gris.

Sello Liberitas (certificación)

El Sello Liberitas es un programa de certificación criptográfica construido encima del motor, con criterios deliberadamente más estrictos que el modo académico:

Análisis granular

El texto se evalúa en segmentos para capturar obras parcialmente IA donde un capítulo podría ser generado y el resto humano.

Veto por género

Para emitir el sello hay que pasar varios criterios estadísticos calibrados según el género literario de la obra.

Veto multi-componente

Cualquier capa que detecte indicios suficientes bloquea la emisión, aun cuando otras aprueben.

Audit log inmutable

Cada decisión queda firmada criptográficamente y encadenada en un registro mensual inviolable.

Verificación pública

Cualquier tercero puede confirmar la autenticidad de un sello vía su identificador único.

Apelación documentada

Procedimiento con plazo máximo de 7 días hábiles para revisión humana, también firmada en el registro.

Sección 04

Principios de Diseño

Los siguientes principios guían cada decisión técnica del sistema:

1. Verum in dubio pro humano

Ante la duda, el sistema no marca el texto como IA. Las cohortes literarias de control (clásicos españoles, TFG humanos verificados) se usan para fijar el umbral hasta que los Falsos Positivos caen a niveles residuales.

2. Trazabilidad por encima de magia algorítmica

Cada cifra del sistema está trazada a una versión concreta de modelo y a un conjunto de pesos firmado. No publicamos métricas que no podamos reproducir.

3. Defensa en profundidad

Ningún componente decide solo. La certificación exige el acuerdo de varios análisis independientes. Si cualquiera detecta indicios, no hay sello —aunque los otros aprueben.

4. Adversarialidad anticipada

El corpus de entrenamiento incluye textos generados por los principales LLMs comerciales modernos en español y sus variantes humanizadas (light y heavy) para simular las herramientas de evasión que un atacante real usaría.

5. Auditabilidad legal

El registro de auditoría es el ancla probatoria del sistema. Está diseñado para que reescribir entradas pasadas invalide automáticamente todas las posteriores y se detecte en una pasada de verificación.

6. Honestidad sobre los límites

Lo que el sello no garantiza está explícitamente documentado (sección 8). No prometemos detectar modelos generativos futuros ni distinguir una corrección ortográfica de una asistencia masiva.

Sección 05

Arquitectura del Sistema (Vista General)

Pipeline conceptual

Documento (PDF / DOCX / TXT / MD) │ ▼ Extracción de texto y metadatos │ ▼ ┌────────────────────────────────────────────────────────┐ │ Análisis multi-capa (en paralelo) │ │ · Detectores de patrones lingüísticos │ │ · Análisis estadístico del texto │ │ · Inspector de metadatos del documento │ │ · Ensemble neuronal de modelos nativos en español │ └────────────────────────────────────────────────────────┘ │ ▼ Agregación calibrada → score + decisión tri-estado │ ├─────────────────────────────────────┐ ▼ ▼ Modo Académico Modo Certificación (informe + anotación visual) (veto multi-componente) │ ▼ Audit log inmutable + cert_id

Decisión tri-estado

Resultado Significado operativo
humano Patrones consistentes con escritura humana. Candidato a sello.
inconcluso Señales contradictorias o insuficientes. Requiere revisión humana.
IA Indicios convergentes de generación automática.

El estado inconcluso es una decisión deliberada de no decidir. Es preferible delegar al juicio humano que emitir una falsa garantía.

Análisis granular por segmentos

Para manuscritos extensos (libros, tesis), el sistema segmenta el texto en bloques y aplica el análisis completo a cada bloque, agregando posteriormente los resultados con criterios estadísticos robustos. Esto permite detectar el caso real más frecuente: un manuscrito mayoritariamente humano con uno o varios capítulos generados por IA.

El criterio de agregación evita rechazar una obra entera por un único bloque anómalo: el veto exige acuerdo de varios segmentos antes de activarse.

Sección 06

Validación y Resultados

Cohortes de validación

El sistema se valida sobre cohortes independientes construidas a partir de manuscritos públicos de repositorios institucionales españoles (descarga vía OAI-PMH), garantizando mediante hash SHA-256 que ningún manuscrito del benchmark estuviera presente en el corpus de entrenamiento:

  • Cohorte académica humana. Trabajos de fin de grado y máster defendidos antes de la generalización de los LLMs, recogidos de dos universidades politécnicas públicas (varias disciplinas técnicas).
  • Cohorte de manuscritos largos académicos. Tesis doctorales y libros publicados por repositorios universitarios y por un organismo público de investigación de ciencia básica.
  • Cohorte humanística y literaria. Libros, tesis y manuscritos de literatura clásica española, poesía, teatro del Siglo de Oro, tratados religiosos históricos, historia del arte, crítica cinematográfica y leyendas — recogidos de un repositorio universitario público de gran biblioteca histórica.
  • Cohorte adversarial IA. Textos generados con LLMs comerciales modernos no presentes en el corpus de entrenamiento del motor, en sus variantes original, light humanización y heavy humanización.
  • Cohorte mixta. Textos parcialmente IA con intervención humana posterior.

Resultados clave (29 mayo 2026)

Validación sobre 1.400 manuscritos con metodología anti-leakage por identificador documental (922 humanos + 478 IA generados con 5 modelos de lenguaje comerciales, incluyendo uno nunca presente en el corpus de entrenamiento):

Métrica Comportamiento sobre cohorte limpia
NPV (valor predictivo negativo) 100 %
FPR global sobre cohorte humana (922 docs) 0 %
FPR sobre literatura humanística y poesía clásica españolas 0 %
FPR sobre tesis doctorales y libros académicos largos 0 %
FNR sobre cohorte IA (478 docs, 5 LLMs) 0 %
Recall sobre cohorte IA 100 %
Detección sobre modelo IA nunca presente en train 100 % (cohorte de 30 manuscritos)
Accuracy sobre decisiones firmes 100 %
Cobertura por género novela · ensayo · poesía · cuento · académico · no-ficción · periodismo · teatro · educativo

Interpretación

El sistema de producción está calibrado a favor de los Falsos Negativos (preferimos no detectar un IA antes que marcar un humano como IA). Esta es una decisión consciente y documentada, alineada con la asimetría de costes para una editorial.

Para casos de uso universitario donde el coste de no detectar es mayor, el sistema expone un modo de operación más sensible que devuelve inconcluso en zona gris en lugar de humano, forzando revisión académica.

Reproducibilidad

Cada decisión emitida por el sistema queda asociada a la versión exacta de los modelos y a los pesos firmados que la produjeron. Una auditoría externa puede solicitar reproducir un veredicto histórico y obtendrá el mismo resultado siempre que se conserve la misma versión de modelo.

Sección 07

Gobernanza, Auditoría y Trazabilidad

Audit log inmutable

Toda decisión —positiva o negativa— produce una entrada en un registro mensual append-only. Cada entrada contiene:

  • Identificador único de la certificación (cert_id).
  • Timestamp UTC ISO-8601.
  • Decisión final.
  • Género literario declarado.
  • Metadatos del autor / título / ISBN (declarados por la editorial).
  • Hash criptográfico SHA-256 del texto del manuscrito.
  • Recuento de palabras.
  • Versiones de modelos y calibración activos en el momento.
  • Resumen del análisis (estadísticas agregadas por bloque).
  • Hash de la entrada anterior (encadenamiento criptográfico).
  • Firma HMAC-SHA256 sobre la entrada canónica.

Garantías criptográficas

Hash-chain SHA-256

Cada entrada referencia el hash de la línea anterior completa. Modificar una entrada antigua invalida el encadenamiento de todas las posteriores y se detecta en una pasada de verificación.

HMAC-SHA256

Cada entrada se firma con una clave secreta custodiada según prácticas estándar de gestión de claves criptográficas (vault / KMS). Sin la clave, generar entradas auténticas es computacionalmente inviable.

Canonicalización JSON

La firma se calcula sobre una serialización determinista, garantizando que dos representaciones del mismo objeto produzcan la misma firma.

Verificación pública

Cualquier tercero puede verificar la autenticidad de un sello sin acceso al log completo:

  • Consulta del cert_id en el endpoint de verificación pública.
  • Comparación del SHA-256 del manuscrito actual contra el SHA-256 registrado en el momento de emisión.
  • Consulta del estado de integridad del registro mensual.

La verificación devuelve la entrada original más los eventos de override posteriores (revocaciones, apelaciones aceptadas), de modo que el estado público de un sello refleja siempre la última decisión auditada.

Procedimiento ante una disputa legal

  1. Localización del cert_id en el log mensual correspondiente.
  2. Verificación integral del archivo mensual completo para descartar manipulación.
  3. Reproducibilidad: el campo model_versions permite recargar exactamente la combinación de pesos que produjo la decisión. El campo text_sha256 permite verificar que el manuscrito presentado en juicio es el mismo que el sistema evaluó.
  4. Re-evaluación con esos pesos. Si los scores coinciden, la decisión queda probada como producto determinista del sistema en esa fecha.
Sección 08

Marco Legal del Sello

Naturaleza del Sello

El Sello Liberitas es una declaración técnica firmada sobre el resultado de un análisis automatizado. No es un dictamen pericial notarial ni una declaración jurada sobre la autoría última del texto. Su valor probatorio reside en la trazabilidad criptográfica y la reproducibilidad del análisis, no en una garantía absoluta de "escrito por humano".

Qué DECLARA el sello

El análisis automatizado realizado por el sistema Liberitas, en la versión vigente a la fecha indicada, sobre el manuscrito con el hash SHA-256 registrado, no detectó indicios de generación por inteligencia artificial superiores a los umbrales calibrados de dicha versión.

Qué NO garantiza el sello

  1. No garantiza que la obra haya sido escrita íntegramente por un humano sin asistencia menor (correctores ortográficos, búsqueda de sinónimos, traducción puntual). El sello es sobre detección automatizada, no sobre autoría notarial.
  2. No garantiza inmunidad frente a modelos generativos futuros. La evaluación se hace bajo el estado del arte de la fecha de emisión.
  3. No sustituye el juicio editorial humano en casos inconcluso o premium_required.

Procedimiento de apelación

Existen dos vías documentadas:

  • Apelación de denegación. El autor o la editorial solicitan reconsideración aportando evidencias (borradores previos, historial de versiones, capturas, drafts).
  • Solicitud de revocación. La editorial retira un sello previamente emitido (auto-denuncia o detección de manipulación posterior).
Servicio de nivel garantizado

Ambos eventos se registran de forma firmada. SLA de resolución: 7 días hábiles para la revisión humana.

Revocación

Un sello puede revocarse en los siguientes casos:

  1. Manipulación post-emisión: el SHA-256 del texto actual no coincide con el registrado, indicando alteración del manuscrito después de obtenido el sello.
  2. Auto-denuncia editorial.
  3. Hallazgo posterior: revisión humana o auditoría externa demuestra que el sello fue emitido sobre un manuscrito que no debería haberlo recibido.

El estado revocado queda en el registro con su cert_id original y es visible públicamente en la verificación.

Sección 09

Casos de Uso

Editoriales

Flujo típico:

  1. La editorial sube el manuscrito final junto con metadatos del autor, título, ISBN y género literario.
  2. El sistema analiza, aplica los criterios de veto y devuelve un identificador único de certificación.
  3. Si el resultado es positivo, la editorial incorpora el identificador en el colofón del libro y/o en la ficha web. Cualquier lector, librero, biblioteca o investigador puede verificar la autenticidad de forma pública.
  4. Si el resultado es negativo o inconcluso, se abre el procedimiento de revisión humana y, en su caso, apelación.

Beneficios:

  • Diferenciador comercial verificable frente a la sospecha generalizada del lector.
  • Marco claro para responder a denuncias de uso de IA en el catálogo.
  • Trazabilidad legal en caso de disputa con autor o tercero.

Universidades

Flujo típico:

  1. El estudiante o el sistema de gestión académica sube el TFG / tesis.
  2. El sistema produce un informe con anotaciones por segmento, scores por sección y decisión tri-estado.
  3. El tribunal o el director revisa el informe; los segmentos inconcluso o IA son objeto de conversación con el alumno.

Beneficios:

  • Material concreto para defender una decisión académica.
  • Reducción del coste de revisión: el evaluador llega ya al fragmento sospechoso.
  • Trazabilidad para procedimientos disciplinarios.

Auditoría editorial post-publicación

Una editorial, un medio o un instituto literario pueden auditar una obra publicada sometiéndola al sistema y comparando contra el identificador de certificación original, detectando manipulaciones posteriores a la emisión del sello.

Integración B2B vía API

Todos los endpoints del sistema son consumibles programáticamente. Los flujos típicos incluyen integración con CMS editoriales, plataformas académicas y marketplaces de libros (filtros "con Sello Liberitas").

Sección 10

Comparativa con Alternativas

Detectores anglocéntricos

Dimensión Detectores anglocéntricos Liberitas
Modelo base Entrenado sobre LLMs antiguos en inglés Modelos nativos en español
Cohorte de control Inglesa moderna Clásicos españoles + TFG humanos verificados
Humanización adversarial Frecuentemente vulnerable Corpus de entrenamiento incluye variantes humanizadas
Decisión Binaria (score 0-1) Tri-estado + veto multi-componente
Trazabilidad Score sin firma Audit log inmutable con cadena criptográfica
Verificación pública No documentada Endpoint público por identificador único
Apelación Procedimiento opaco Flujo firmado con SLA de 7 días hábiles

Detección manual por experto

Dimensión Experto humano Liberitas
Velocidad Horas por manuscrito Minutos por manuscrito extenso
Reproducibilidad Subjetiva Determinista, trazada a versión firmada
Cobertura Lecturas selectivas Análisis completo del manuscrito
Coste marginal Alto Bajo
Asistencia al juicio Informe anotado + heatmap por sección
Complementariedad

El sistema no sustituye al experto humano: lo complementa focalizando su atención y aportando un soporte trazable. El override humano firmado en el log es parte explícita del workflow.

Sección 11

Limitaciones Conocidas

Falsos positivos residuales en literatura clásica

Algunos autores con registro formal denso del español pre-1930 producen scores elevados incluso post-calibración. Gestión: umbrales de género más permisivos en literatura y criterio de veto robusto que exige acuerdo de varios segmentos; revisión humana en casos límite.

Humanización adversarial extrema en textos cortos

Texto IA reescrito pesadamente por humano en obras cortas tiende a caer en inconcluso. Esto es comportamiento deseado (no certificar en duda), no un fallo a corregir.

PDFs escaneados sin OCR

El sistema rechaza con error explícito cualquier documento del que se extraigan menos de un mínimo de palabras. No realizamos OCR.

Cobertura lingüística

El sistema está calibrado para español peninsular y americano contemporáneos. No está validado para catalán, gallego, euskera ni para variantes históricas anteriores al siglo XIX.

Modelos generativos futuros

El detector está calibrado contra los LLMs conocidos a la fecha de emisión de cada sello. Un modelo generativo significativamente distinto podría requerir un re-entrenamiento. Por eso cada sello incluye la versión del modelo y el timestamp: la garantía está acotada al estado del arte en el momento del análisis.

Sección 12

Roadmap

Corto plazo

Refinamiento de la calibración por género literario sobre cohortes ampliadas. Validación de FPR sobre autores contemporáneos consolidados.

Medio plazo

Incorporación de los próximos releases comerciales de LLMs en el pipeline adversarial de entrenamiento. Procesos automatizados de re-evaluación contra nuevos modelos generativos.

Largo plazo

Cobertura de variantes regionales del español (peninsular, mexicano, rioplatense, caribeño, andino). Estudio de viabilidad para portugués (Brasil y Portugal) y catalán.

Continuo

Publicación periódica de model cards reproducibles por release. Auditorías externas independientes sobre el registro inmutable.

Sección 13

Glosario

Accuracy
Proporción de predicciones correctas sobre el total.
Audit log
Registro append-only inmutable de cada decisión, firmado criptográficamente.
cert_id
Identificador único de cada decisión emitida por el Sello, verificable públicamente.
Decisión tri-estado
humano / inconcluso / IA. El estado intermedio existe para forzar revisión humana en zona gris.
FNR (False Negative Rate)
Proporción de textos IA clasificados como humanos. Medida del riesgo de "se nos cuela un IA".
FPR (False Positive Rate)
Proporción de textos humanos clasificados como IA. Medida del riesgo reputacional para una editorial.
Hash-chain SHA-256
Secuencia de hashes donde cada entrada incluye el hash de la anterior. Modificar una entrada antigua invalida toda la cadena posterior.
HMAC-SHA256
Código de autenticación de mensaje basado en hash, firmado con una clave secreta. Garantiza autenticidad.
Humanización
Técnica adversarial que reescribe texto IA para evadir detectores. Puede ser light o heavy.
NPV (Negative Predictive Value)
Precisión del predictor cuando predice "humano". Métrica crítica para el Sello: cuando decimos "humano", queremos que lo sea de verdad.
Veto multi-componente
Criterio de certificación que exige que todos los análisis independientes aprueben. Cualquiera puede bloquear.