Páginas

viernes, 26 de julio de 2013

A vision for data science (toolkit)

Data Science (la ciencia de los datos) y Big Data son términos en boga. Muchos proyectos de investigación  se centran únicamente en la recolección de datos y su posterior almacenamiento en enormes  repositorios. Sin embargo, el verdadero valor que puede potenciar el despegue de los datos como ciencia no es su recolección tal cual sino en la disponibilidad de herramientas de análisis,  integración,  búsqueda y transformación de datos que sepan operar con grande volúmenes de datos complejos, de tipos distintos y contextos variados, como los que se encuentran en Big Data. El termino ciencia en Data Science se refiere pues a la necesidad de encontrar nuevos algoritmos de integración que sepan unir (no reescribir en otro lenguaje otra vez) piezas ya existentes, ponerlas a trabajar en arquitecturas basadas en módulos integrables y compatibles con los requisitos de Big Data, y que ademas sepan sacar el máximo jugo a esos datos. Complicado? Mejor reutilizar y convertir formatos de datos que escribir miles de algoritmos de nuevo, no? Todo esto nos lo cuenta Chris A Mattman, jefe del proyecto para iniciativas de Big Data de la NASA en el comentario de abajo.
C.A. Mattman. A vision for data science. Nature 493:473-475. doi:10.1038/493473a

domingo, 21 de julio de 2013

Se busca geobibliotecario

The librarian  (El bibliotecario) es un serie de películas al estilo de Indiana Jones, donde el protagonista  es una especie de bibliotecario-aventurero que trabajo para una sección "oculta" de la biblioteca de Nueva York, siempre presto a resolver inteligentemente (por eso es bibliotecario) cualquier situación inesperada.  Aunque la serie no es ningún  prodigio, me he acordado de ella al toparme con las siguientes  ofertas de trabajo para Universidades americanas casi al unisono  (Mayo/Junio 2013):
En resumen, todas las ofertas destacan como requisito fundamental que el candidato/a tenga diploma o máster en documentación con conocimientos en SIG, y ademas, en todas ellas se destacan como tareas preferibles a desempeñar ofrecer servicios de referencia, llevar a cabo actividades de enlace entre departamentos que lleven a cabo actividades haciendo uso de SIG y el mantenimiento de la colección de datos geográficos (creación, organización, análisis y preservación, así como gestión de metadatos). Otras funciones, ya no identificadas por todas las ofertas por igual, son la participación en grupos de investigación internos sobre SIG, desarrollo de proyectos e iniciativas en SIG, alfabetización y actividades de difusión de SIG.

Las ofertas anteriores están acotadas al contexto de las bibliotecas universitarias americanas. Lo cual no significa que deba ocurrir esta tendencia en España. El hecho, casi innegable hoy en día, es que el rol de "geobibliotecario" no existe ni parece que se perciba como necesario  en el contexto español. Sin embargo, creo que estas ofertas ya marcan un claro camino de las nuevas tendencias y roles que las bibliotecas deben adoptar  para mantener su protagonismo en la sociedad actual en general y en el contexto universitario en particular. Desde la perspectiva de un investigador  en IG, me llama poderosamente la atención  los siguientes aspectos de estas ofertas de trabajo 

(1) Se pide como formación primaria documentacion, complementado con conocimientos de SIG a nivel de experiencia y/o formación  En este sentido, me alegra que se conserve la figura del documentalista/bibliotecario como formación primaria pero a la vez especializado en SIG.  Es una cuestión de adaptarse o morir, pero con sentido común  o servicios de una biblioteca deben adaptarse a los cambios sociales y tendencias en tecnologías  y es una realidad hoy en día que la IG es un tipo de datos omnipresente en la vida cotidiana  Cuando nos daremos cuenta en España de esta transformación?

(2) Se hace hincapié implícitamente en la trasversalidad de la IG para muchas disciplinas, con el hecho de que las bibliotecas universitarias ofrezcan un servicio común pero especializado a los departamentos e investigadores de una universidad. En este sentido, la IG deja de ser algo especifico de unos pocos para convertirse en un servicio troncal para la comunidad universidad. Ahora mismo, tan solo hay que ver la emergencia de los proyectos Smart Campus de las universidades españolas para darse cuenta de la importancia del mantenimiento , acceso, compartición y provisión de la IG.

(3) Se enfatiza en el rol de la gestión de estas colecciones por parte de personal bibliotecario especializado, los llamados "geobibliotecarios". No es nuevo que las bibliotecas gestionen colecciones de recursos para la comunidad universitaria  como por ejemplo los repositorios institucionales de artículos científicos. En este caso, por ejemplo, el personal de la biblioteca pide a los investigadores los artículos publicados y se encarga de generar los metadatos correspondientes, publicar todo junto en el repositorio , y suministrar al investigador el handler para que tenga acceso al articulo de forma permanente. El investigador produce los datos (en forma de articulo científico) y el bibliotecario se encarga de su gestión en forma de metadatos, documentacion y registro para facilitar el acceso publico y compartición. 

Y aquí hemos tocado con hueso duro. Eso mismo es el eterno problema en la comunidad SIG. ¿Quien documenta adecuadamente los datos geográficos que se van generando continuamente? ¿Lo hace el creador del recurso? Debería, y así es en algunos casos, pero no es la practica habitual. Parece que hay un gran vacío cuando se aborda la creación de metadatos de recursos SIG. Se percibe en general como una aspecto vital para la comunidad SIG, pero no se vislumbra quién o qué perfil puede desempeñar con claridad ese rol. Evidentemente, existen herramientas software de generación de metadatos que hasta cierto punto ayudan a rellenar algunos descriptores de metadatos aunque la supervisión humana es aun necesaria. Tal como ocurre con el ejemplo del mantenimiento de la colección de  artículos científicos en un repositorio institucional, ¿podría ser el "geobibliotecario" la persona adecuada por formación y conocimientos para la catalogación y documentacion de las colecciones de datos geográficos  No me parece para nada una idea tan descabellada y resolvería un gran problema en la comunidad SIG. 

Tal como anunciábamos anteriormente y mucho antes en el ultimo capitulo del libro "The Fourth Paradigm: Data-Intensive Scientific Discovery", el cual termina con  algunas acciones y recomendaciones para llevar a cabo este cambio hacia una ciencia basado en grandes cantidades de datos. Una de ellas dice (las negritas son mías): 
"Establish digital libraries that support other sciences such as GIS in the same way the National Library of Medicine supports the bio-sciences". 

jueves, 18 de julio de 2013

El rol de GI en documentación

Los servicios basados en la localización (LBS por sus siglas en inglés) responden en función donde uno se encuentra en un momento dado, es decir, su posición actual. Piensa en una app que te muestra las farmacias, restaurantes, tiendas, bares, o cualquier punto de interés cercano a tu posición actual. Si te mueves (cambias de posición), la respuesta del servicio variará según a la nueva localización. Sin embargo, en los LBS actuales, la localización y las tecnologías geo-espaciales son importantes, pero aún no son el corazón del servicio. Todavía se echa de menos servicios realmente especializados, dirigidos a cada individuo, que actúen geo-proactivamente haciendo uso del rico contexto geo-espacial mucho más allá de la mera localización.
En un artículo publicado en EPI hemos sugerido algunos usos de la localización y de las tecnologías geo-espaciales en las unidades de información [1]. Se trata de un primer paso para aupar la localización a un lugar central en el diseño de servicios para colectivos de unidades de información como pueden ser documentalistas. ¿Por qué no buscar libros por la zona donde ha nacido (o reside actualmente) el autor? ¿O por la referencia geográfica del libro (p.e. guía turística de la Toscana) en vez de por su temática o palabras clave? Por qué no recuperar los documentos de cierta provincia o región?
Una agradable sorpresa ha sido encontrarme hace poco con el sitio web Spain in Books. Se trata de un mapa web interactivo que permite enlazar lugares interesantes de España con las temáticas de libros. Selecciona sobre el mapa la Ciudad de las Ciencias y Artes de Valencia y obtendrás la lista de libros asociados. Es simple, cómodo e intuitivo para el ser humano, pero representa un cambio radical con respecto al status quo: la localización se integra por defecto en el interfaz de acceso para la consulta del catálogo de libros. Bienvenidos sean ejemplos donde sitúen la localización en el corazón de la futura generación de servicios!
[1] E. Aguilar-Moreno, C. Granell-Canut. Sistemas de información geográfica para unidades de información. Profesional de la Información, 22(1):80-86, 2013. doi:10.3145/epi.2013.ene.11

miércoles, 10 de julio de 2013

¿Hay alternativa al actual sistema de evaluación científica?

Cada Junio surge la misma discusión a raíz de la publicación  de los nuevos índices de impacto JCR. Parece claro, aunque en realidad  no es así, que estos índices no son adecuados  para la evaluación  de la carrera investigadora de un individuo. Pero las agencias de evaluación y  comités de promoción en las universidades se apoyan casi exclusivamente en el número de artículos publicados en revistas de impacto. Podría y hay alternativas a la métrica basada en únicamente  el numero de artículos. Vamos a desgranar algunas ideas a lo largo de los próximos días.

Se habla de excelencia  en la  investigación e impacto internacional, pero se omite completamente el impacto real de los artículos, es decir, no se tiene en cuenta su contenido. Hay otras métricas que pueden ayudar a dar un valor aproximado de ese impacto. Lo más inmediato es el número citas recibidas de un artículo. Pero claro, otra vez estamos hablando de un número aislado, sin contexto . Todo esto nos lleva a que, mas que hablar del impacto de un único artículo, deberíamos analizar y evaluar el impacto científico de toda una línea de investigación  realizada por un individuo. El impacto científico de una investigación puede incluir varios proyectos de investigación, artículos, capítulos de libros, aportaciones a estándares, colaboraciones en congresos, captación de recursos  y otros tantos  tipos de "recursos" científicos  que analizados de forma conjunta muestren claramente el progreso realizado de un individuo y entonces poder apreciar y analizar su impacto científico.

Tampoco tiene mucho sentido hablar de línea de investigación de un único individuo, sino del grupo o colaboradores con los que ha trabajado. La ciencia no se hace de forma individual, sino colectivamente y estableciendo colaboraciones. Tiene sentido hablar de cómo y en qué grado contribuye un individuo en el grupo y en definitiva a la linea de investigación. Al igual que en un película tenemos el director, guionista, actores, y demás personal con roles bien definidos que llevan a cabo de forma conjunto una película, en ciencia tenemos un grupo de investigadores que persigue desarrollar una línea de investigación  y cada uno de ellos tiene un rol bien definido:  captador de recursos, jefe proyecto, establecer colaboraciones, análisis de datos, buena mano en escribir informes y artículos, etc. A un guionista se le premia por su rol de guionista en una película, a un investigador  se le debería evaluar en función de su contribución al grupo y a la linea de investigación.

El sistema de evaluación  actual cuenta los guiones escritos, sin interesarse si han acabado en película, en el cajón, y ni siquiera saber que historia cuentan.

sábado, 6 de julio de 2013

Ciencia abierta: ¿resultados más rápidos y mejores?

A la gente en su tiempo libre le gusta compartir hobbies con otras personas. También le gusta ayudar, a menudo de forma altruista, en actividades que le motiven. Hay multitud de ejemplos de colaboración voluntaria por parte de la comunidad para recoger datos y luego compartirlos. Con esta premisa, si se pudiera canalizar una pequeña parte del excedente cognitivo de la comunidad [1] para tareas científicas, esto significaría una auténtica revolución para la ciencia: más recursos, más mentes, más datos, más ideas, más de todo.

Ciencia abierta significa hacer públicos los datos de un proyecto científico. Pero no únicamente los datos son públicos, sino los métodos, problemas pendientes de resolver, interpretación de los resultados obtenidos, tareas de diseminación, etc. relacionados con un proyecto científico. El objetivo que persigue es involucrar a la comunidad a que participe en todas las facetas que definen un proyecto científico que sea de su interés. Al fin y al cabo es poner en práctica los principios usados en proyectos de software de código abierto a la Ciencia en general.

Ya hay algunas experiencias interesantes, como el caso de ciencia abierta en que la comunidad ha colaborado en la definición de un proceso de química inorgánica [2] (no soy experto, lo dejamos como "proceso"). Me he fijado en este estudio porque toca cuestiones fundamentales para el éxito de un proyecto de ciencia abierta. Los autores destacan dos puntos claves que también considero de sentido común y necesarios para, al menos encarrilar - que no asegurar-, el éxito de un proyecto de ciencia abierta. El primero es no empezar desde cero. Partir de un núcleo básico. Esto es un patrón común en proyectos de código abierto: el núcleo de Apache Server nació por ejemplo de un reducido grupo de programadores. Luego el proyecto se abrió a la comunidad. El segundo aspecto clave para incentivar la participación de la comunidad es, ni más ni menos, minimizar las barreras de entrada para que la comunidad participe. Mensajes simples, tareas bien definidas, y que quede claro qué se espera de la comunidad en todo momento. Si alguien quiere participar en un proyecto científico, que entienda sin problemas ni ambigüedades cómo puede participar y colaborar en algunas de las tareas. En realidad, dos aspectos de mucho sentido común, caen por su propio peso.

Pero, con una estrategia de ciencia abierta, ¿se obtienen realmente resultados de forma más rápida y científicamente válidos, que con el método tradicional de grupos "cerrados" de científicos? Si es así, ¿se debe elegir un grupo relativamente pequeño de expertos, focalizado en el ámbito de estudio del proyecto, o abrir el abanico a grupos más grandes? ¿Cómo se anima o incentiva a la participación de la comunidad? ¿Cómo se capta y se mantiene el interés de la comunidad en un proyecto? ¿Todas las disciplinas (software, química, medio ambiente, sociales, etc.) son susceptibles de ser utilizadas para la ciencia abierta?

[1] C. Shirky. Cognitive Surplus: Creativity and Generosity in a Connected Age. Penguin, 2010.
[2] M. Woelfle et al. Open science is a research accelerator. Nature Chemistry, 3:745-748, 2011. doi: 10.1038/nchem.1149

miércoles, 3 de julio de 2013

JRC Open Day 2013

El pasado Mayo 2013 fue el Open Day en el JRC, un evento bianual de puertas abierta con el fin de comunicar y acercar al público y a la sociedad en general la ciencia e investigación que se realiza en el JRC. Se realizaron muchas actividades didácticas, juegos y exhibiciones dedicadas principalmente a escolares y a los más pequeños.

Algunas áreas de investigación, en mi opinión, son más dadas a la diseminación que otras. Por ejemplo, la unidad que investiga los envoltorios y el contacto de éstos con la comida. Todo el mundo tiene una idea clara de esto porque ocurre diariamente en la vida de las personas: cuando vamos al supermercado, cuando cocinamos, cuando compramos pan. La comida en estos casos está en contacto con el envoltorio. ¿Qué sucede si ambos entran en contacto durante largo tiempo en condiciones de altas de temperaturas, como cuando olvidamos una paleta de plástico en una sartén al fuego? También me llamó la atención el uso del agua en la producción de ciertos alimentos. Una taza de café necesita 124 litros de agua y un kilo de carne más de 15000 litros de agua! Impresionante, verdad? Deberíamos comer mucho más verde si queremos, además de encontrarnos más sanos, salvaguardar nuestro planeta y ser más sostenibles.

En las geo-ciencias, ¿resulta más fácil o más difícil encontrar este tipo de ejemplos didácticos para la comunicación de la información geográfica y Digital Earth? ¿Cómo explicamos sus ventajas, impacto y valor añadido en las vidas de los ciudadanos? ¿Utiliza la gente Digital Earth en sus tareas diarias? ¿Conoce la gente el valor que supone el uso de la información geográfica?

La Digital Earth Unit hizo un gran trabajo este año, creando una exhibición dinámica con vídeos  juegos con mapas, póster explicativos, apps de crowdsourcing para generar un mapa de ruido, drones,  y sobre todo, hablar mucho y mucho con los visitantes. La gente entraba en la exhibición sin saber que significa Digital Earth y salían con una clara percepción de este concepto, y  muchos de ellos incluso entusiasmados con la posibilidad de participar en proyectos de ciencia ciudadana (citizen science). Tal vez, esta última sea la característica sobre la que los geo-científicos deban incidir para comunicar la información geográfica a la sociedad y enganchar a los ciudadanos en proyectos científicos relacionados de Digital Earth y de impacto para la sociedad.

lunes, 1 de julio de 2013

Cursos de comunicación de la ciencia

Recientemente he terminado un curso en MiriadaX sobre Investigaciócientífica 2.0.1 y al mismo tiempo tuve la oportunidad de asistir a un breve curso de dos días sobre Communicating science to the public impartido  por David Zaruk. Ambos cursos trataron  perspectivas distintas de la comunicación  de la ciencia. El curso de MiriadaX profundizó más en la diversidad de herramientas colaborativas y redes sociales al alcance de un investigador, mientras que el segundo curso se centró en la comunicación vista como un proceso de dialogo para  influir en el receptor, es decir, en identificar la audiencia, la estrategia y el contenido del mensaje dependiendo del contexto particular en que se debe comunicar ciencia. Bien, algunas breves conclusiones personales. 

El primer aspecto clave ha sido valorar adecuadamente toda la riqueza que contiene el proceso de comunicación de la ciencia al público. No hay un tipo, sino muchas estrategias para comunicar ciencia. No hay un único tipo de público, sino muchos tipos públicos que requieren distintos mensajes. No es una tarea trivial y sencilla, sino que requiere esfuerzo, perseverancia y práctica (de ahí este blog!). 

La estructura  del mensaje, la estrategia narrativa, el timing, y el medio en que se va a publicar el mensaje (artículo en periódico, blog, tuits, etc.), son aspectos que hay que tener muy en cuenta ya que dependen del contexto particular en que vamos a comunicar ciencia. No es lo mismo comentar mi opinión personal sobre un artículo de investigación en este blog que, por ejemplo, dar mi opinión como científico sobre un tema controvertido que me pide un comité de ética. La narrativa, el público y el proceso de comunicación son necesariamente distintos en cada una de estas situaciones, lo cual  requiere dar un paso atrás y adoptar la mejor estrategia en cada caso.

Si quieres que alguien se interese por tu mensaje, debes captar su atención antes. Regla de oro. No hay más. A la gente le encanta oír historias... pues usemos historias (storytelling) para captar la atención del público cuando comuniquemos ciencia!

La cantidad y diversidad de herramientas digitales al alcance de la mano de un investigador para difundir ciencia es cada día mayor. Pero no nos abrumemos, no hace falta comunicar en todos los medios. Es buena idea al principio escoger un único medio  (blog, prensa escrita., vídeos de divulgación  redes sociales, etc.) en el que uno se  sienta cómodo y utilizarlo de forma activa y constante. Esto es clave: como toda habilidad, hay que practicarla a menudo para llegar a dominarla.  

Y por último, el objetivo no es que el público se acerque a los científicos y a la ciencia, sino que los científicos se acerquen a la sociedad, y comunicar entonces ciencia sobre las cosas que realmente interesan a la sociedad. 

Un poco de geo-perspectiva...

"A la tercera va la vencida!". Espero que sea así. Este es el tercer intento de arrancar este blog. Varios cambios en la plataforma y en la orientación del blog han causado dos intentos frustrados. Lo bueno, porque hay que ser optimista, es que aún sobra motivación para arrancar por tercera vez.

Este blog pretende hablar de ciencia, y  también pretende hablar de la ciencia que hago, relacionada con la información geográfica.

Este blog también intenta acercar la ciencia a la sociedad. Es un experimento para aprender a comunicar ciencia y en definitiva de intentar dar un paso modesto para dar a conocer el impacto y beneficio de la ciencia de la información geográfica en la sociedad actual. En fin, dar un poco de geo-perspectiva...