PRUEBA CALIFICADA 4º sec biomoleculas y bioelementos .docx
Datos abiertos en un mundo de grandes datos (Acuerdo ICSU-IAP-ISSC-TWAS)
1. Datos abiertos en un mundo de grandes datos
.
Un acuerdo internacional
(2015):
ICSU - International Council
for Science
IAP - The InterAcademy
Partnership
ISSC - International Social
Science Council
TWAS - The World
Academy of Sciences
.
2. oportunidades científicas en un mundo rico en datos
• capacidad de adquirir, almacenar, manipular y transmitir
instantáneamente grandes y complejos volúmenes de datos
• numerosos conjuntos de datos pueden ser semánticamente
vinculados para crear significados más profundos
• aprovechar estas oportunidades plantea serios desafíos a la
forma en que la ciencia se ejecuta y se organiza
Los datos abiertos son el elemento común que
lo hace posible
• La apertura efectiva de datos solo puede ser realizada si hay
acción sistémica a nivel personal y disciplinario, nacional e
internacional
3. definición de datos abiertos
Los datos deben ser "inteligentemente abiertos":
• Descubribles - una búsqueda en Internet puede revelar
fácilmente su existencia
• Accesibles - los datos se pueden importar o se puede acceder
desde una computadora
• Inteligible - información de antecedentes para dejar en claro
la relevancia de los datos en relación a la cuestión específica
objeto de la investigación
• Valorables - los usuarios deben ser capaces de evaluar
cuestiones tales como la competencia / intereses de los
productores de datos
• Utilizable - metadatos adecuados + el código relevante
cuando se ha utilizado computación para crear datos
derivados
4. Veremos como la aplicación de los principios de Datos
Abiertos es responsabilidad de
científicos/as
instituciones de investigación y las universidades
editores/as
organismos de financiación
asociaciones profesionales, sociedades científicas
y academias
bibliotecas, archivos y repositorios
Responsabilidades nacionales
Responsabilidades internacionales
5. Los principios de Datos Abiertos
Responsabilidades de los/las científicos/as financiados con
fondos públicos
• que los datos de investigación estén abiertos y puedan ser
reutilizados
• que la lógica de relación entre los datos y las afirmaciones
pueda ser rigurosamente analizada y la validez de los datos
comprobada por replicación de experimentos u
observaciones.
• datos depositados en repositorios confiables
datos abiertos reutilizables
6. Deposite sus datos en el repositorio de su institución + busque repositorios en
ww.re3data.org (1.400) y en www.opendoar.org (153)
7. Los principios de Datos Abiertos
Responsabilidades de las instituciones de
investigación y las universidades
• crear un entorno de apoyo para los datos abiertos:
capacitación en gestión, preservación y análisis de datos y el
soporte técnico pertinente, incluyendo servicios de biblioteca
y de gestión de datos.
• las instituciones que emplean a los científicos, y los
organismos que los financian, deben desarrollar incentivos y
criterios de promoción para aquellos involucrados en los
procesos de datos abiertos .
movilizar las capacidades de uso intensivo de
los datos
8. Los principios de Datos Abiertos
Responsabilidades de los editores/as
• poner a disposición de los evaluadores los datos durante el
proceso de revisión
• requerir acceso abierto inteligente a los datos al mismo
tiempo que la publicación que los utiliza
• exigir las referencias y citas completas de esos datos
• poner a disposición el registro científico para su posterior
análisis mediante el suministro abierto de los metadatos y el
acceso abierto para minería de textos y datos
9. Los principios de Datos Abiertos
Responsabilidades de los organismos de financiación
• considerar los costos de los procesos de datos abiertos en los
proyectos de investigación como parte intrínseca del costo de su
realización
• proporcionar recursos y políticas adecuados para la sostenibilidad a
largo plazo de la infraestructura y repositorios
política nacional de datos abiertos
• las instituciones que emplean a los científicos, y los organismos que
los financian, deben desarrollar incentivos y criterios de promoción
para aquellos involucrados en los procesos de datos abiertos
• la evaluación del impacto de la investigación, particularmente los
indicadores que involucran métricas de citación, deben tomar en
cuenta la contribución de los creadores de datos
10. Los principios de Datos Abiertos
Responsabilidades de las asociaciones profesionales,
sociedades científicas y academias
deben
desarrollar directrices y políticas de datos abiertos
y
promover las oportunidades que los datos abiertos
ofrecen de forma tal que refleje las normas epistémicas
y las prácticas de sus miembros.
11. Los principios de Datos Abiertos
Responsabilidades de las bibliotecas, archivos y
repositorios
desarrollo y prestación de servicios y normas
técnicas para los datos, de tal forma que
aseguren
• su disponibibilidad para quienes deseen
utilizarlos
y que
• los datos sean accesibles en el largo plazo
12. Los límites de la apertura de datos
Los datos abiertos deben ser la posición por defecto para la
ciencia financiada con fondos públicos.
Las excepciones deben limitarse a cuestiones de:
Privacidad
Seguridad
Uso comercial en el interés público
Excepciones justificadas caso por caso, y no como
exclusión general
13. Prácticas habilitantes
• Citación y procedencia
En publicaciones académicas, cuando los investigadores utilizan datos
creados por otros, éstos deben ser citados con referencia a su autor, a
su procedencia y a un identificador digital permanente.
• Interoperabilidad
Tanto los datos de investigación como los metadatos que permiten la
evaluación y reutilización de los datos, deben ser interoperables en la
mayor medida posible
• Reutilización no restrictiva
Datos de investigación etiquetados como reutilizables (ej.: licencias no
restrictivas)
• Capacidad de vinculación
Datos abiertos vinculados con otros datos basados en su contenido y
contexto, con el fin de maximizar su valor semántico
14.
15. ICSU-IAP-ISSC-TWAS Accord
www.icsu.org/science-international/accord
Documento preparado por un grupo de trabajo
de
ICSU - International Council for Science
IAP - The InterAcademy Partnership
ISSC - International Social Science Council
TWAS - The World Academy of Sciences
………….
• Geoffrey Boulton, Universidad de Edimburgo,
Presidente de CODATA, Preside el Grupo de Trabajo
• Simon Hodson, Director Ejecutivo de CODATA
(representante ICSU)
• Dominique Babini, CLACSO y Universidad de
Buenos Aires (representante ISSC)
• Jianhui Li, Academia China de Ciencias-CNIC
(representante IAP)
• Tshilidzi Marwala, Universidad de Johannesburgo
(representante TWAS)
• Maria G. N. Musoke, Universidad de Makerere,
Uganda (representante IAP)
• Paul F. Uhlir, Académico, Academia Nacional de
Ciencias de Estados Unidos (representante IAP);
consultor independiente en política y gestión de
datos.
• Sally Wyatt, Universidad de Maastricht,
eHumanities-KNAW (representante ISSC)
• .
Hinweis der Redaktion
Este acuerdo sobre “datos abiertos en un mundo de grandes datos” agrega la voz distintiva de la comunidad científica internacional a la de los gobiernos y organismos intergubernamentales que han hecho del caso de los datos abiertos un pre-requisito fundamental para mantener el rigor de la investigación científica y la maximización del beneficio público de la revolución de los grandes datos (big data), tanto en los países desarrollados como en aquellos en desarrollo.
El acuerdo afirma que la investigación financiada con fondos públicos debe llevarse a cabo de manera a crear un máximo beneficio público. Y la liberación de los datos es la ruta óptima para lograrlo.
El acuerdo identifica las oportunidades y desafíos de la revolución de datos como un tema de actualidad y predominante para la política científica global.
Propone principios fundamentales que deben ser adoptados para dar respuesta a ellos
Hay muchas áreas de investigación donde estas capacidades son profundamente relevantes: en predicción meteorológica y climática; en la comprensión del funcionamiento del cerebro; en el comportamiento de la economía global; en la evaluación de la productividad agrícola; en las previsiones demográficas; en historias a desentrañar; y en muchos de los desafíos globales contemporáneos como los del cambio ambiental, las enfermedades infecciosas y la migración masiva, que requieren combinar conocimientos y datos de muchas disciplinas.
Es un contexto muy cambiante, por ej. En 2003 los científicos declararon que el mapeo del genoma humano estaba completo. Llevó más de 10 años y costó 1 billón de dólares - hoy se tarda apenas unos días y cuesta una pequeña fracción de dicho monto (USD 1.000).
Los gobiernos también tienen datos que son de gran importancia para la ciencia, como ej. ciencias sociales
En ese contexto se ubica este acuerdo de la comunidad científica internacional sobre los principios fundamentales y ej. de buenas prácticas que deben ser adoptados en el tema de datos abiertos de investigación
Si los datos, metadatos y el código utilizado en cualquier manipulación no están disponibles no puede ser objeto de una prueba adecuada de replicación
Un número creciente de investigadores comparten sus datos desde el inicio de sus proyectos de investigación, tanto para recibir los comentarios de otros investigadores como también para para participar en proyectos colaborativos de investigación. Importantes procesos de abierto intercambio de datos se han desarrollado en áreas tales como la lingüística, la bioinformática y cristalografía química. En paleogenética humanos, parece que el intercambio de datos abierta es casi universal (> 97%),
Ejs. de responsabilidades internacionales: CODATA y Research Data Alliance (RDA) organizan actividades de capacitación en diversos lugares del mundo
Los científicos financiados con fondos públicos tienen la responsabilidad de contribuir al bien público a través de la creación y comunicación de nuevos conocimientos,
en los cuales los datos asociados son parte intrínseca. Ellos deben hacer que esos datos estén disponibles abiertamente a los demás, después de su producción, tan pronto como sea posible
Cuando se publica un documento haciendo una afirmación científica, es esencial que los datos probatorios, los metadatos relacionados que permiten re-análisis, y los códigos utilizados en la manipulación por computadora, se abran al mismo tiempo al escrutinio para asegurar que se mantiene el proceso vital de autocorrección. Recientes demostraciones en varias disciplinas de altas tasas de no-reproducibilidad de los resultados de los trabajos publicados, enfatizan la necesidad crucial de revitalizar procesos de datos abiertos para un mundo de grandes datos. La apertura no es sin embargo suficiente. Los datos deben ser inteligentemente abiertos, lo que significa que deben ser: descubribles, accesibles, inteligibles, evaluables y reutilizables
Los recientes intentos de replicar de forma sistemática los resultados de una serie de artículos publicados en revistas de gran prestigio tuvieron éxito en sólo un bajo porcentaje, por ejemplo, oncología preclínica (53 trabajos, sólo el 11% replicable), la psicología social (100 artículos, sólo el 39% replicable) y la economía (67 documentos, sólo el 33% replicable). Las razones aducidas para estas fallas incluyen la falsificación de datos, razonamiento estadístico inválido y datos o metadatos ausentes o incompletos.
En la medida de lo posible, los datos deben ser depositados en repositorios bien gestionados y confiables, con bajas barreras de acceso. Depositar sus datos en el repositorio de su institución y/o en repositorios de datos (ww.re3data.org con 1.400 repositorios de datos, en febrero de 2016) y / o repositorios generales (www.opendoar.org con 153 repositorios que informan tener conjuntos de datos, febrero de 2016) .
Las excepciones a los datos abiertos deben limitarse a cuestiones de privacidad, de seguridad y de uso comercial en el interés público
Las instituciones de investigación tienen la responsabilidad de promover y facilitar procesos de datos abiertos financiando infraestructura y servicios, estimulando la investigación sobre los fundamentos de la ciencia de datos; y aceptando que el costo de los datos abiertos es un costo inseparables de hacer investigación.
Los editores de revistas que publican afirmaciones científicas deben requerir que los datos probatorios estén disponibles al mismo tiempo en forma interligentemente abierta en un repositorio confiable de datos . Es un principio fundamental de la transparencia y la reproducibilidad en la investigación que los datos subyacentes a una afirmación científica puedan ser accesibles para realizar pruebas
Financiadores de la investigación tienen la responsabilidad de promover y facilitar procesos de datos abiertos mediante la financiación de infraestructura; proporcionar líneas de financiación específicos para apoyar la reutilización de los datos abiertos y la investigación sobre los fundamentos de la ciencia de datos; y mediante la creación de incentivos, aceptando que el costo de los datos abiertos es un costo inseparables de hacer investigación.
prácticas que aseguren un funcionamiento eficiente de un sistema nacional de datos abiertos compatible con las normas internacionales
En este acuerdo sobre datos abiertos han participado ICSU, ISSC, The InterAcademy Partnership (IAP) que es la red global de academias de ciencias de países del mundo y The World Academy of Sciences (TWAS), en español La Academia Mundial de Ciencias, es una academia que reúne científicos de 70 países.
Las Academias Nacionales y Sociedades Científicas se destacan por hablar directamente con los investigadores y expresar principios y prioridades de la investigación en sus campos específicos. Deben desarrollar directrices y políticas de datos abiertos y promover las oportunidades que ofrecen los datos abiertos de manera que reflejen las normas y prácticas de sus miembros
Las bibliotecas institucionales tienen el rol de recolectar, organizar, preservar y dar acceso al conocimiento. Se van adaptando al cambio tecnológico del papel a formato digital y a las cuestiones de gestión de datos abiertos destacadas por este acuerdo, pero es una transición que requiere un esfuerzo y apoyo sostenido
La apertura debe ser la posición por defecto para los datos científicos aunque hay excepciones
Privacidad y confidencialidad: Compartir conjuntos de datos que contienen información personal es de importancia crítica para la investigación en muchas áreas de las investigaciones médicas y sociales, pero plantea retos para la gestión de los datos y la protección de la confidencialidad. La anonimización completa de los registros personales en bases de datos es imposible. Una manera de hacer frente a estos problemas es a través de lo que se denomina en ocasiones "refugios seguros", donde los datos se mantienen físicamente seguros, y sólo a disposición de los investigadores de buena fe, con sanciones legales contra la divulgación no autorizada. En algunos casos, el consentimiento para la publicación de los datos puede ser apropiado.
Un examen cuidadoso de los límites de la apertura es importante cuando una investigación podría ser mal utilizada para amenazar la seguridad individual y la seguridad pública o la salud
Puede haber un interés público en la comercialización de los descubrimientos científicos, para el mayor beneficio del público en la jurisdicción nacional en la que se hizo el descubrimiento.
Ya que es difícil trazar límites generales para cada uno de estos casos, deben ser apicados discriminación caso por caso, ya que ha habido muchos descubrimientos importantes en los cuales suprimir la liberación de los datos o privatizar el conocimiento habría sido altamente retrógrado, como en el caso del descubrimiento de la electricidad, del código genético humano, de Internet, etc.
citación es un componente importante del sistema de reconocimiento académico y la recompensa. Por lo tanto, la integración de la práctica de la citación de datos debe ser visto como un paso importante en la provisión de incentivos para 'sharing' datos
Los datos deben ser liberados al dominio público tan pronto como sea posible después de su creación. Los datos en que se basa una afirmación científica deben ser librados en el dominio público al mismo tiempo que la publicación de la afirmación. Algunos financiadores permiten demorar por un período limitado la liberación de los datos.
Un identificador digital permanente es particularmente importante cuando los subconjuntos de datos son creados de forma dinámica y hay diferentes versiones de los conjuntos de datos
metadatos adicional es necesaria para determinar la procedencia de la
de datos y de entender las circunstancias en las que fueron creados y
de qué manera pueden ser reutilizados. Existen normas en la mayoría de las disciplinas de investigación
por la forma en que se deben describir los datos y las circunstancias
de su creación informado.
define interoperabilidad como la habilidad de dos o más sistemas o componentes para intercambiar información y utilizar la información intercambiada. La interoperabilidad es un atributo que facilita en gran medida el uso de los datos de la investigación
reutilización:
Diferentes ministerios u organismos de investigación pueden adoptar una política que Permite que los datos de investigación producidos a través de sus fondos para ser colocados en el
dominio público
En ausencia de una ley amplia que permite la reutilización, re-difusión
y la interoperabilidad jurídica de los datos, una renuncia a los derechos voluntaria o una
no limitativo, de "uso común" licencia puede ser utilizado por el titular de los derechos
(Ver: www.creativecommons.org).
Si los datos de investigación no están ya en el dominio público, deben ser etiquetados como reutilizables por medio de una renuncia a derechos o licencia no restrictiva que deja claro que los datos pueden ser reutilizados sin otro requisito que la de reconocimiento al autor. El Grupo de Interés de CODATA-RDA sobre la interoperabilidad jurídica de los datos de investigación ha producido Principios y Directrices en este tema
Estos son los requisitos para un eficiente entorno de datos abierto, donde la tecnología es sólo una parte. Las partes sumergidas, relacionadas con procesos, organización, habilidades personales, la motivación y el carácter distintivo de cada especialidad científica
Las acciones que promueven la utilización de prácticas apropiadas para datos abiertos de investigación pueden clasificarse en tres categorías: las que alientan a los investigadores a exponer sus datos en abierto, las que fomentan el uso de datos abiertos, y las que desalientan la utilización de datos cerrados. El rol de los actores clave necesitan ser considerados: quienes financian la investigación, las instituciones de investigación, los editores y los mismos investigadores. Estos actores son los elementos clave de la comunidad de investigación. Tienen que trabajar juntos para asegurar que los datos se consideran productos legítimos y citables de la investigación; con citas de datos que se consideren de la misma importancia en la promoción académica que las citas a otros formatos como son los textos publicados.