Análisis de la Comunidad Científica Nacional en Ciencias de la Computación - Memoria de Título para optar a Ingeniero Civil Informático en la Universidad de Concepción, Chile. Nota máxima.
Beginners Guide to TikTok for Search - Rachel Pearson - We are Tilt __ Bright...
Memoria de Título
1. Un Análisis de la Comunidad Científica
Nacional en Ciencias de la Computación
Jaime A. Terán Moya
Prof. Patrocinante: Sra. Andrea Rodríguez T.
Agosto, 2007
2. Contenidos
• Descripción General y Objetivos
• Métricas e Indicadores Analizados
• Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
3. Descripción General y
Objetivos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
4. Descripción General
• ¿Ciencias de la Computación?
• Comunidades como Redes Sociales
• ¿Por qué es importante evaluar?
• ¿Cómo hacerlo?
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
5. Objetivos
• Definición e incorporación de información a
un modelo de datos.
• Análisis y comparación de métricas.
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
6. Redes Complejas
• Alto número de unidades dinámicas e
interconectadas
• Topología Característica
• Small World Networks
• Scale Free Networks
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
7. Contenidos
✓ Descripción General y Objetivos
• Métricas e Indicadores Analizados
• Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
8. Métricas e Indicadores
Analizados
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
10. Publicaciones
• cito a, citado por
• Temporalidad
• Medios de Publicación
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
11. Publicaciones 2
• Referencias/Publicaciones
• H-Index
• Número de publicaciones
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
12. Co-Autoría
• Caracterización
topológica de la red
• Centralidad de nodos en
la red
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
13. Co-Autoría 2
• Topología
• Distribución de
Grados de la red
• Presencia y tamaño de
un componente
gigante
• Ruta mínima promedio
• Coeficiente de
clustering
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
14. Co-Autoría 3
• Centralidad
• Número de Co-autores
• Cercanía (closeness)
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
15. Co-Autoría 4
• Centralidad
• Interconexión
(betweenness)
• PageRank
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
16. Contenidos
✓ Descripción General y Objetivos
✓ Métricas e Indicadores Analizados
• Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
17. Fuentes de Información e
Integración
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
18. DBLP
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
19. DBLP
Ventajas:
• XML (390+MiB) + DTD
• Clasificación de documentos
• Información por documento
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
20. DBLP
Problemas:
• Referencias cruzadas
• Baja capacidad de ingreso
• Sesgo
• Identificación de personas
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
22. Google Scholar
Ventajas:
• Resultados ordenados por relevancia
• Número de citas actualizado
• Listado ‘citado por’
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
23. Google Scholar
Problemas:
• No API o XML
• Resultados no 100% fiables
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
24. Web of Science
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
25. Web of Science
Ventajas:
• Acceso vía Web Services
• Búsqueda exacta según diferentes criterios
• Relaciones ‘cita a’ y ‘citado por’ entre
documentos indexados
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
26. Web of Science
Problemas:
• Pobre en material relativo a Ciencias de la
Computación
• Acceso restringido
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
27. Publicación
id
Publicación_autor tipo_fk
Revista/Conf
id journal_fk
id
publicacion_fk titulo
titulo
autor_fk año
tipo
posicion dblp_key
citas_gs
citas_wos
Autor Autor_dblp_fondecyt
id autor_id
nombre autor_fondecyt_fk
Autor_fondecyt
id
Institucion_Depto Institución nombre1
id id nombre2
institucion_fk nombre apellido1
departamento_fk pais apellido2
institucion_fk
departamento_fk
Departamento
id
nombre
Modelo de Datos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
28. toDB()
NO SI
¿Existe?
Insertar Rescatar ID PUB
Rescatar ID PUB
NO SI
¿Autor en
cola?
NO SI
NO SI
¿Existe ¿Existe?
Journ/Conf?
Rescatar ID Insertar Rescatar ID AUT
Insertar
JOUR/CONF
Rescatar ID Rescatar ID AUT
JOUR/CONF
Relacionar ID
Relacionar ID
PUB + ID JOUR/
PUB + ID AUT
CONF
fin
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
29. Publicación
id
Publicación_autor tipo_fk
Revista/Conf
id journal_fk
id
publicacion_fk titulo
titulo
autor_fk año
tipo
posicion dblp_key
citas_gs
citas_wos
Autor Autor_dblp_fondecyt
id autor_id
nombre autor_fondecyt_fk
Autor_fondecyt
id
Institucion_Depto Institución nombre1
id id nombre2
institucion_fk nombre apellido1
departamento_fk pais apellido2
institucion_fk
departamento_fk
Departamento
id
nombre
Modelo de Datos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
31. Publicación
id
Publicación_autor tipo_fk
Revista/Conf
id journal_fk
id
publicacion_fk titulo
titulo
autor_fk año
tipo
posicion dblp_key
citas_gs
citas_wos
Autor Autor_dblp_fondecyt
id autor_id
nombre autor_fondecyt_fk
Autor_fondecyt
id
Institucion_Depto Institución nombre1
id id nombre2
institucion_fk nombre apellido1
departamento_fk pais apellido2
institucion_fk
departamento_fk
Departamento
id
nombre
Modelo de Datos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
32. inicio DB
SI
XML
¿datos?
Publicaciones
NO ¿Publicación
fin citingArticles
en cola?
SI
Título, Año ut
SI
NO
¿datos?
searchRetrieve
Citas Web of Science
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
33. 277/834
33,2 %
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
34. inicio
Publicaciones
nacionales y DB
autores
NO ¿Publicación
fin actualizar
en cola?
SI
Construcción
URL
SI
NO
¿citas?
cURL
Citas Google Scholar
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
35. Google Scholar v/s Web of Science
Comparando las Top 10:
• Top 10 WoS tienen datos en GS
• 6 previas al 2000 en WoS, 2 en GS
Sin embargo:
• WoS no considera auto-citas
• WoS sólo considera datos indexados
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
36. Problemas
• Incompletitud y accesibilidad de relaciones
• Tamaño del grafo
• Nombres
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
37. Contenidos
✓ Descripción General y Objetivos
✓ Métricas e Indicadores Analizados
✓ Fuentes de Información e Integración
• Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
38. Análisis de Datos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
40. Métricas
• Número de Publicaciones
• H-Index en base a los datos de GS
• H-Index en base a los datos de WoS
• Número de co-autores
• Citas promedio en base a GS y el número de
publicaciones
• Citas promedio en base a WoS y el número
de publicaciones
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
41. Ranking & Comparación
Rank #Pubs 1
Rank Co-A 0,791429882 1
Rank h-GS 0,889590105 0,674904654 1
Rank h-WoS 0,784187662 0,623087252 0,803371338 1
Rank avgGS 0,55462994 0,406154185 0,796117283 0,649332508 1
Rank avgWoS 0,531160828 0,391395307 0,599777774 0,874112818 0,642437539 1
Rank #Pubs Rank Co-A Rank h-GS Rank h-WoS Rank avgGS Rank avgWoS
Relación entre h-index según GS y WoS
Relación entre h-index y número de publicaciones
70
80
70
60
60
50
50
h-index (WoS)
h-index (GS)
40
40
30
30
20
20
10
10
0
0
0 10 20 30 40 50 60 70 80
0 10 20 30 40 50 60 70 80
h-index (GS)
#Publicaciones por autor
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
42. Publicaciones por autor
12
10
8
Autores
6
4
2
0
1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148
Publicaciones
Publicaciones por autor
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
43. ¿Dónde se publican los artículos?
120
100
80
56
50
s En Conferencia
44
60
En Journal
40
36
40
33
26
45
18 41
20 37
11 31
25
18
6 15
13
10
5
0
Top 10 Top 20 Top 30 Top 40 Top 50 Top 60 Top 70 Top 80 Top 90 Top 100
¿Dónde publican los autores
nacionales?
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
44. ¿Dónde se publican los artículos?
900
800
700
600
604
580
500
499 En Conferencia
En Journal
419
400
344
300
265
192
200
121
228
221
202
182
100 157
56 136
109
80
45
0
Top 100 Top 200 Top 300 Top 400 Top 500 Top 600 Top 700 Top 800 Top 900
¿Dónde publican los autores
nacionales?
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
45. 27% Revistas
73% Actas de Conferencias
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
46. 140
120
100
80 #Pubs
#en Revistas
#en Conferencias
60
40
20
0
05
04
03
02
01
00
99
98
97
96
95
94
93
92
91
75 90
9
*
98
06
20
20
20
20
20
20
19
19
19
19
19
19
19
19
19
19
-1
20
19
Evolución Temporal
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
47. Actas con mayor publicación nacional
40
35
30
25
20
15
10
5
0
LA-WEB
LATIN
SCCC
SAC
SPIRE
PODS
CRIWG
CIARP
SPIRE/CRIWG
CPM
Actas de mayor publicación
nacional
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
48. Revistas con mayor publicación nacional
16
14
12
10
8
6
4
2
0
Theor. Comput. Sci.
Pattern Recognition
Pattern Recognition
Inf. Process. Lett.
Acta Inf.
Algorithms
Computers & OR
Algorithmica
CoRR
BIT
J. Discrete
Letters
Revistas de mayor publicación
nacional
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
49. Revistas / Actas con mayor tasa de citas por publicación
según GS
50
45
40
35
30
25
20
15
10
5
0
Theor. Comput.
Inf. Process.
Algorithmica
Algorithms
SAC
SPIRE/CRIWG
CP
PODS
CoRR
CPM
J. Discrete
Lett
Sci.
Revistas/Actas de mejor
rendimiento según GS
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
50. Revistas / Actas con mayor tasa de citas por publicación
según WoS
6
5
4
3
2
1
0
Theor. Comput.
SWAT
Acta Inf.
Inf. Process.
Algorithmica
SPIRE/CRIWG
CoRR
CP
PODS
CPM
Lett
Sci.
Revistas/Actas de mejor
rendimiento según WoS
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
51. Investigadores por Institución
3% 3%
14%
21%
EMPRESA
3% PUC
1% PUCV
UCHILE
6% 1%
UCN
UDEC
UFRO
UMAG
USACH
UTFSM
17% UVALPO
30%
1%
Investigadores por Institución
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
52. Publicaciones por Institución
2% 1%
10%
15% 0%
EMPRESA
1% PUC
2%
1% PUCV
UCHILE
UCN
UDEC
UFRO
9%
UMAG
0% USACH
UTFSM
UVALPO
59%
Publicaciones por Institución
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
55. Distribución de grados
450
400
350
300
Número de nodos
250
200
150
100
y = 256,69x −2,004
50
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Grado €
Distribución de Grados
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
56. Distribución de pesos
600
500
400
Frecuencia
300
200
y = 487,44 x −2,1123
100
0
€
9..10
10..11
11..12
12..13
13..14
14..15
15..16
16..17
0..1
1..2
2..3
3..4
4..5
5..6
6..7
7..8
8..9
Rango
Distribución de Pesos
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
61. Contenidos
✓ Descripción General y Objetivos
✓ Métricas e Indicadores Analizados
✓ Fuentes de Información e Integración
✓ Análisis de Datos
• Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
62. Conclusiones y Trabajo Futuro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
63. Conclusiones
• Estado del arte
• Interpretación de métricas
• Caracterización de la red
• Co-Autoría de Primer Grado
• Herramientas disponibles
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
64. Trabajo Futuro
• Incorporar áreas de trabajo por investigador
• Disponibilidad de datos vía XML
• Definir nuevas perspectivas de análisis
• Definir mecanismos de comparación de
comunidades a nivel macro
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación
66. Un Análisis de la Comunidad Científica
Nacional en Ciencias de la Computación
¡Gracias!
Jaime A. Terán Moya
Prof. Patrocinante: Sra. Andrea Rodríguez T.
Agosto, 2007