Boletín 10:1
 ASOCIACIÓN PARA LA CONSERVACIÓN DEL PATRIMONIO
CULTURAL DE LAS AMÉRICAS

Septiembre 2000

EL COSTO DE LOS PROYECTOS DE DIGITALIZACION DE IMAGENES*(1)

Introducción
Cuando se planifica un proyecto de digitalización de imágenes existen muchos componentes que necesitamos considerar, incluyendo los siguientes:
- Selección
- Preparación
- Creación de metadatos: catalogación/ descripción/ indexación
- Preservación/ conservación del objeto físico
- Producción de procesos intermedios
- Digitalización
- Control de calidad de las imágenes y de metadatos
- Infraestructura técnica
- Mantenimiento continuo de las imágenes y los metadatos

Esta última categoría, el mantenimiento a largo plazo de las imágenes digitales y metadatos asociados, frecuentemente no es considerada como parte del costo del proyecto, pero estos gastos deben ser asumidos por la institución, de manera que es mejor planificar este costo desde el principio del proyecto. Una publicación que es útil para planificar y presupuestar los diversos costos de un proyecto digital de imágenes es la "Planilla de Trabajo del Grupo de Biblioteca de Investigación" para estimar el costo del reformateo digital ("Research libraries group Worksheet for Estimating Digital Reformating Cost.") (2). Un estudio reciente de costos que da una visión sobre varios de los costos relacionados con los proyectos de digitalización de imágenes es "El costo de distribución de imágenes digitales: las implicaciones sociales y económicas de la producción, distribución y uso de datos de imágenes" (The Cost of Digital Image Distribution : the Social and Economic Implications of the Production, Distribution and
Usage of Image Data) de Howard Besser y Robert Yamashita. Este proyecto del MESL (Museum Educational Site Licencing) cubre los costos asociados a la creación y la distribución de imágenes digitales para fuentes artísticas, pero muchos de los puntos relacionados con los costos son aplicables a otros tipos de proyectos de imágenes digitales. Los autores son escépticos sobre la disminución futura de los costos del desarrollo y mantenimiento de las colecciones de imágenes digitales, y concluyen que por medio del acceso digital no será posible ahorrar costos a corto plazo.


Análisis de costos de digitalización
-Cuantó va a costar realmente un proyecto de digitalización de imágenes? Cada proyecto será diferente, pero estamos comenzando a recopilar datos que pueden ser usados como referencia para determinar si un proyecto específico está dentro de los parámetros de costos conocidos. Las tablas 1 a 5 presentan los costos y porcentajes estimados y reales provenientes de diferentes proyectos.
Nota: Los costos promedio totales, los costos promedio unitarios, y los porcentajes de los promedios unitarios fueron calculados de conjuntos de datos ligeramente diferentes, ya que no todos los costos estaban disponibles en cada proyecto. Por lo tanto, los costos promedio unitarios suman más que los costos promedio totales y los porcentajes unitarios suman más que el 100%. Los "promedios ajustados" no incluyen el costo de proyectos individuales que significativamente exceden el promedio y están fuera de la distribución normal usando un histograma de frecuencias. Los costos que se muestran entre corchetes [$], son el total de los costos promedio individuales. Los porcentajes que se muestran entre corchetes [%], están normalizados al 100%. Los promedios ajustados y totales derivan de una cantidad de fuentes que incluyen la Biblioteca Nacional Digital de la Biblioteca del Congreso (LC) (The Library of Congress National Digital Library), Concurso Ameritec, Rondas Uno 1966 y Tres 1999 (Ameritec Competition, Round One (1996), Three (1999)); el Proyecto de Acceso Electrónico de la Administración Nacional de Archivos y Registros (NARA-EAP) (the National Archives and Records Administration´s Electronic Access Proyect), finalizado en Abril 1999; y de otros proyectos con cifras publicadas.

 Proceso   LC/Ameritech  NARA-EAP GLOBAL  Promedio Ajustado
Digitalizar
Creación de Metadatos
Otros (4)
Totales

Imágenes/día (5)

$6,60
$12,40
Incluídos arriba
$19,00

40 

  $7,60 (3)
Hasta $7,60
No disponible
Est $12,60-17,60

200

$6,50
$9,25
$13,40
$23,45[$29,15]

45  

$6,15
$7.00
$10,10
$17,65 [$23,25]

25

Tabla 1: El costo promedio por imagen y cifras de producción para proyectos de digitalización de imágenes


A pesar de que el rango real de las cifras puede variar significativamente, en general, pareciera que las cifras de producción se desglosan de la siguiente manera:
- 1/3 del costo es la conversión digital (32% del total).
- Ligeramente menos de 1/3 es el costo de la creación de los metadatos, incluyendo catalogación, descripción e indezación (29% del total).
- Ligeramente más de 1/3 del costo corresponde a otras actividades, como la administración y el control de calidad (39% del total).
Algunos estudios publicados han calculado los costos de digitalizar archivos de textos tales como archivos de 1-bit (los más apropiados para documentos impresos con una tipografía clara) así: ( 6 )
- $0,31 a $0,34 por página a producir y mantener por 10 años.
- $0,12 adicional por página para hacer respaldo en microfilm de salidas en computadora (COM, Computer Output Miccrofilm).
- $0,43 a $0,46 por página a digitalizar, producir los COM, y almacenar por 10 años.
El costo de digitalizar y cubrir el mantenimiento permanente será proporcional a la cantidad de datos, consecuentemente, serán más costosos de producir y mantener los archivos más grandes. A continuación se compara el tamaño de los archivos con los costos de digitalización :
- El costo de imagen de textos de 1-bit (en promedio 75-100 KB) es de $0,31 a $0,34.
- Los archivos maestros de NARA-EAP tamaño promedio 10Mb costaron $7,60.
- Los documentos NARA-EAP de mayor tamaño en promedio 70Mb, costaron $20 por escaneado de intermediarios. (El archivo más grande producido fue de 300 Mb y su costo $40 a $50 escanearlo de un intermedio).
- Imágenes comerciales de Fotografía en CD tienen un promedio de 18Mb y $2 por escaneo de intermediarios, hasta $1 por Mb del tamaño final del archivo escaneado a medida.


 Proceso   Colecciones mixtas (7)  Item único
(por página)
(8)
Colecciones Fotográficas (por foto)  Libros/ Folletos
(por página)
Digitalizar
Creación de Metadatos
Otros
Totales

$9,35
$10,60
$11,40
$24,45 [$31,35]

  $5,30
$10,40
$17,20
$29,55 [$32,90]

$7,60
$5,85
$13,45
$19,30 [$26,90]

$4,30
$5.60
$3,55
$8,35 [$13,45]

Tabla 2: Costo promedio de varias categorías de material

 Proceso   Colecciones mixtas
(por ítem)
 Items únicos
(por página)
Colecciones Fotográficas (por foto)  Libros/ Folletos
(por página)
Digitalizar (9)
Creación de Metadatos
Otros
Totales

37% [34%]
32% [30%]
39% [36%]
100%

  15%
40%
45%
100%

28% [27%]
28% [27%]
48% [46%]
100%

49% [47%]
26% [25%]
29% [28%]
100%

Tabla 3: Porcentajes del costo promedio de varias categorías de material


Además de crear imágenes digitales, una cantidad de proyectos de digitalización basados en textos producen textos localizables, ya sea volviendo a teclear la información o volviendo a digitalizar, usando programas de digitalización (Reconocimiento Óptico de Caracteres) (OCR, Optical Character Recognition). El costo promedio de OCR incluye una mezcla de proyectos que utilizan tanto OCR sin corregir, datos originales, y datos corregidos.
La tabla 4 presenta los costos que han sido reportados para ambos.
Las cifras de costo promedio pueden ayudar a las instituciones al evaluar proyecciones de costos, pero en la vida real pocos proyectos están en este promedio, y los costos en los extremos de los rangos podrían ser legítimos.

 Proceso   Costo de volver a teclear textos por página (U$S) % por volver a teclear textos
(por página)
Costo de OCR (por página) % por OCR
(por página)
Digitalizar (9)
Creación de Metadatos
Otros
Totales

$3,50
$4,00
$3,90
$8,80 [$11,40]

31%[30%]
18%
53%[52%]
100%

$1,20
$1,45
$1,40
$4,40 [$14,05]

42% [38%]
35% [31%]
34% [31%]
100%

Tabla 4: Costos promedios y porcentajes relativos para crear archivos de textos localizables


La tabla 5 presenta rangos de costos que han sido reportados por algunas instituciones para varias etapas del proceso de digitalización. Como se verá, los costos estimados y reales pueden fluctuar dentro de un rango amplio.

 Categoría de Digitalización   Digitalización Creación de Metadatos Otros Costos globales
Proyecciones globales
Proyecciones Ajustadas
Colecciones Mixtas
Items Únicos
Fotografías
Lobros/Folletos
Textos Reindizados
OCR

$0,25 - $19,80
$0,25 - $16,65
$3,45 - $16,50
$1,90 - $8,00
$2,30 - $16,65
$2,10 - $6,10
$2,55 - $5,00
$0,25 - $6,30

$0,75 - $34,65
$0,75 - $17,25
$2,85 - $17,25
$5,75 - $12,85
$4,85 - $6,45
$1,50 - $11,10
$2,35 - $5,70
$0,75 - $2,40

$0,45 - $50,20
$0,45 - $28,15
$4,50 - $21,55
$7,60 - $28,15
$3,35 - $24,65
$1,35 - $6,90
Datos limitados
$0,40 - $2,10

$1,85 - $96,45
$1,85 - $42,45
$3,25 - $40,50
$23,10 - $35,80
$5,20 - $42,45
$4,60 - $14,40
Datos limitados
$1,85 - $7,65

Tabla 5: Rangos de costos que han sido reportados en procesos de digitalización


La Tabla 6 presenta un resumen de las cifras de los costos relativos por categoría para digitalización de varios tipos de material, incluyendo la creación de archivos de texto localizables. Simon Tanner y Joanne Lomax Smith del Servicio de Digitalización de la Educación Superior (HEDS) del Reino Unido han hecho un abordaje similar de estimación de costos globales usando cifras comparativas de costos basadas en proyecciones promedio, en un trabajo presentado en 1999 en la "Conferencia sobre recursos digitales para las humanidades". Los autores crearon la "Matriz del HEDS de factores que afectan el costo potencialmente" (10), la cual compara los costos relativos de los diferentes aspectos de la digitalización bajo condiciones específicas de escaneo, los diferentes pasos del proceso de digitalización y los archivos finales.

 Categoría de Digitalización   Digitalización Creación de Metadatos Otros Costos globales
Colecciones Mixtas
Items Únicos
Fotografías
Lobros/Folletos
Textos vueltos a teclear
OCR

Más Alto
Más Bajo
Ligeramente más Alto
Más Bajo
Más Bajo
Muy Bajo

Ligeramente más Alto
Ligeramente más Alto
Más Bajo
Más Bajo
Más Bajo
Muy Bajo

Más Bajo
Más Alto
Promedio
Más Bajo
Más Bajo
Muy Bajo

Ligeramente más Alto
Más Alto
Más Bajo
Más Bajo
Más Bajo
Muy Bajo

Tabla 6: Cifras comparativas de costos basadas en proyecciones promedio globales


Costos del mantenimiento permanente
Sólo han sido publicados unos pocos modelos para estimar los costos de mantenimiento de imágenes y ellos varían considerablemente. En 1996, Charles Lowry y Denise Troll estimaron que los archivos digitales podrían llegar a ser 16 veces más caros de mantener y acceder que sus homólogos en papel (11). Al menos un estudio del Gobierno Federal, de la Agencia de Protección Ambiental (Enviroment Protection Agency), indicó que el costo de instalación, los salarios y el mantenimiento de la infraestructura de red y de los datos digitales es en los primeros diez años, hasta 5 veces mayor que la inversión inicial (12).
Dos años atrás, el costo de mantener los archivos maestros de imágenes (off-line) y los archivos de acceso (on-line) para NARA-EAP durante los diez primeros años fue estimado entre el 50% y 100% de la inversión inicial.
El presupuesto cubrió lo siguiente:
- Digitalización $940.000,00
- Ampliación de redes $800.000,00
- Desarrollo de bancos de datos diseñados sobre medidas $ 2.500.000,00.
El costo de desarrollo del banco de datos involucró la programación especial y costó dos veces y media más que el total gastado en digitalizar imágenes, y el costo para mejorar los servidores de archivo para acomodar las imágenes en línea fue casi tanto como el de la digitalización. Con frecuencia los mayores costos de infraestructura de tecnología integrada (Integrated technology) están presupuestados separadamente de los proyectos de digitalización, y por lo tanto, los costos del mejoramiento de la red, y del desarrollo del banco de datos no se tomaron en cuenta al estimar los costos a largo plazo del mantenimiento de las imágenes digitales. Si los costos de infraestructura se incluyen, los cálculos citados abajo serían substancialmente mayores.
En 1999 el cálculo para mantener las imágenes de EAP durante los siguientes 10 años, fue hecho sobre los siguientes factores:
- Mantenimiento mínimo para una sola copia de los archivos maestros:
- Copiar a nuevos discos 2 veces en 10 años a $0,45 a $1,95 por imagen por copia.
- Reformatear el archivo una vez en 10 años a $ 0,80 por imagen.
- Mantener los archivos de acceso y el thumbnail (*) en línea:
- Estimado entre $0,50 a $1,45 por Mb por cada año.
Estos dos costos juntos representan $1,70 a $4,70 por imagen para los diez primeros años o 14% al 38% del costo inicial por imagen ($211.000,00 a $583.000,00).
Un segundo abordaje sería usar el modelo de costos presentado en el informe Cornell sobre microfilmación de salida de computadoras, que informa sobre cálculos de mantenimiento de varios estudios de $0,10 - $0,11 /Mb por año. La estimación para el mantenimiento de archivos NARA?EAP podría ser de $9,65 a $10,62 para los primeros diez años dando un total de $1.200.000,00 a $1.300.000,00. Esto podría representar 55% a 60 % del costo inicial por imagen.
Una tercera aproximación sería contratar un servicio comercial para el mantenimiento de las imágenes digitales y los metadatos asociados. Un modelo comercial propuesto para un servicio comercial de mantenimiento de archivos es:
Almacenamiento de resguardo o respaldo (back-up) 62%.
Amortización de almacenamiento de discos 27%.
Mantenimiento de los equipos (Hardware) 11%.
Esto supone el mantenimiento de múltiples copias de archivo de seguridad y recuperación de datos. El mayor porcentaje del costo de mantenimiento será la mano de obra. De manera que aunque los costos del almacenaje digital continúen bajando (a un promedio del 37.5% por año), el costo global continúa aumentando. Usando estos porcentajes, podemos derivar una tercera estimación basada en el uso de servicios comerciales de $13,60 a $39,40 por imagen para los primeros diez años, representando el 77% al 224% del costo inicial por imagen ($1.700.000,00 a $4.900.000,00). Si el costo del almacenaje digital no disminuye, las cifras serían $48,30 a $140,00 por imagen para los primeros diez años o 275% a 796% del costo inicial por imagen ($6.000.000,00 -$17.400.000,00).
Teniendo en cuenta la gran disparidad en las proyecciones para el mantenimiento de las imágenes digitales y datos asociados, sigue siendo razonable para mantener por los primeros diez años planificar el 50% al 100% del costo inicial, dado que está en el medio del rango de las proyecciones. Esto significa un 5% al 10% del costo inicial por imagen por año, aunque el copiado y la conversión del archivo se hacen anualmente.
Se podría argumentar a favor de las imágenes digitales como un medio que facilita el acceso y mejora el proceso comercial, pero podría no ser el método más apropiado para la retención de la información a largo plazo. En 1998, en una reseña de la Asociación de Gerencia de Imágenes e Información (The Association of Images and Information Managment, AIIM) dice que de 10 tecnologías que afectarán la gerencia de los documentos para los próximos dos años, la quinta es el reemplazo del sistema óptico de discos por las microfichas de COM, por compañías que están encontrando el costo del mantenimiento digital prohibitivo (13).

Conclusión
Esta reseña sobre los costos de los proyectos de imágenes digitales llega a las siguientes conclusiones:
- Las instituciones podrán justificar únicamente el mantenimiento de las imágenes digitales que utilizan.
- Las instituciones tendrán que llevar a cabo un análisis de costo?beneficio para determinar cuanto uso es necesario.
- Un almacenaje análogo, tal como mantener los originales o los microfilms, ofrece mayor duración y menor riesgo a largo plazo.
- Aproximaciones híbridas usando la mejor ventaja de cada tecnología para minimizar las desventajas de las otras, es probable que continúen siendo las más viables.
Es necesario realizar investigaciones adicionales y el análisis de datos teniendo en cuenta lo siguiente:
- El análisis del costo debe hacerse con los costos finales del proyecto, mas que confiar en los costos proyectados. Calcular los costos al comienzo de un proyecto es difícil y con frecuencia el costo final es diferente.
- El análisis de costos puede hacerse de diferentes formas y puede ser ilustrativo observar los costos por persona y la producción por persona como una manera de estimar los requerimientos de infraestructura para varios tipos de proyectos.

Notas:
* Nota del editor del RLG DigNews:
En este número presentamos el artículo de Steven Puglia sobre los costos de digitalización. Como ustedes verán los gastos pueden variar dramáticamente entre una actividad y otra, y entre proyectos y programas. Obviamente estos estudios no responden categóricamente a la pregunta de cuánto va a costar el proyecto pero pueden proveer una estimación inicial basada en la información actualmente disponible.

* Nota del ditor de APOYO:
Todas las cifras son en dólares estadounidenses (US$)

1 Adaptado de una ponencia presentada en el Encuentro de Medios Electrónicos (Electronic Media Group) durante la Reunión Anual del American Institute for Conservation (AIC) en St.Louis, MO, Junio 1999. El autor agradece las contribuciones de Dan Jansen, Carl Fleischhauer y Steve Chapman,
2 "RLG Worksheet for Estimating Digital Reformatting Cost"
<http://www.rlg.org/preserv/RLGWorksheet.pdf>
3 Los costos de adquisición de imágenes incluyen la creación de los archivos maestros, de acceso y thumbnail, encabezamientos de archivos y datos de rastreo y almacenaje en medios primarios y de respaldo.
4 Incluye la identificación y preparación de los materiales, el monitoreo, el control de calidad y el proyecto de gerencia.
5 Cantidad promedio de imágenes por día durante la vida del proyecto. Ciertos aspectos del proyecto, como la digitalización probablemente son hechos en período más cortos con una producción mas alta.
6 De Anne R. Kenney, "Digital to Microfilm Convertion: a Demonstration project", Conversión Digital a Microfilm: Un Proyecto Demostrativo, 1994, 1996.<http://www.library.cornell.edu/preservation/com/comfin.html>
7 Incluye una mezcla de texto, fotografías y otros materiales; costos por item.
8 Items individuales como colecciones de manuscritos.
9 Digitalización significa en este caso dos cosas:
a) la creación de un texto digital al ser tecleado en una computadora utilizando un programa (software) procesador de palabras, o
b) la creación de un texto digital al escanear un material impreso o escrito a máquina el cual crea una imagen, que luego es interpretada como letras o palabras por medio de un programa (software) de reconocimiento óptico de caracteres (OCR).
10 Simon Tanner y Joanne Lomax Smith, "Digitalización: Cuánto cuesta realmente?, Digitization: How much does it really cost?", Septiembre 1999, p.7
<http://hdes.herts.ac.uk/HEDCinfo/Papers/drh99.pdf>
11 Charles Lowry and Denise Troll, Proyecto de una Biblioteca Virtual, "Virtual Library Proyect" Serials Librarian, "NASIG Proceedings: Tradition, Technology and Transformation", Part. 1, Vol. 28, Ns. 1/2, 1996.
12 "EPA Superfund Document Management System Concept", 1991.
13 "Put it here?AIIM 1999: Storage Summary", INFORM, Vol. 13, Issue 6, June 1999.

Nota de traductor:
* Thumbnail: En internet sucesión de imágenes para tener una referencia rápida de su aspecto. Al hacer clic en cualquiera de ellas aparece en pantalla con su tamaño natural.

Este artículo fue publicado en Research Libraries Group, RLG DigiNews, Vol. 3 , Nro. 5 y ha sido traducido y publicado en APOYO con las debidas autorizaciones.

Steven Puglia



Traducido por Rita Feintuch
Nota: Lamentamos el reciente fallecimiento de nuestra colega la Conservadora argentina Rita Feintuch, quien generosamente colaboró con APOYO.


[ Volver INDICE GENERAL ]