Aspectos Básicos de la Actividad Investigadora (ABAI) Eduardo Berrueta

ABAI II. T4: ¿Merece la pena patentar?

En esta última tarea del curso, se nos han propuesto varias entradas para que comentemos la que nos parece más interesante. Después de su lectura, he decidido decantarme por el tema de las patentes y, dentro de este, por la entrada sobre si merece la pena patentar.

Me he decantado por este tema porque siempre me han interesado las patentes. Abre el debate de hasta qué punto es ético hacer negocio con algo como la investigación. Sobre esto, me ha parecido interesantísimo el texto de Lucas Sánchez "Nadando contra patentes". Plantea un problema real que además no puede ser más actual.

Yo soy de los que piensan que incluso en el sistema en el que vivimos, en el que todo se mueve por el dinero y el negocio, hay determinadas líneas rojas que no se deben cruzar a la hora de hacer dinero. Tengo claro que el primero es la sanidad, pero otro podría ser la investigación.

A parte de porque la investigación es un pilar clave en el desarrollo de una sociedad, creo que no se debería hacer negocio con ella por su propia naturaleza. Me explico, en alguna de las entradas de este blog ya comenté algo sobre los resultados negativos en la investigación. Son casi tan importantes como los resultados positivos y hablaba de la necesidad de publicarlos. En una investigación con intereses de negocio, estos resultados negativos no estarán bien vistos porque no producen los beneficios económicos que se buscan.

Con el tema de las patentes pasa algo similar. Lo que comenta Lucas Sánchez en el texto que he leído me ha llamado mucho la atención y me ha decepcionado bastante. En primer lugar porque hay que buscar procesos que no estén patentados para no tener que pagar por esta patente. Si encima a esto le sumas que tienes que patentar tu propia solución, te limita mucho la investigación.

En mi opinión las patentes limitan tanto al que la desarrolla como al que quiere luego utilizarla, afectando así al proceso investigador y dificultando que prosperen nuevos descubrimientos simplemente por la dificultad económica de algunas regiones o instituciones. De nuevo estamos poniendo barreras económicas a la investigación, lo que no deja de ser, en mi opinión, tirarnos piedras a nuestro tejado. Ya no solo por el beneficio que reportarían estas nuevas investigaciones a la sociedad sino también, pensando egoistamente como investigador, por los conocimientos e ideas que podría extraer cada uno para su propio trabajo.

En definitiva, creo que la investigación es suficientemente importante en una sociedad como para que no se mercantilice ni se negocie con ella. Por otro lado, vivimos en una sociedad y en un sistema que se basa en el dinero. Se negocia con la salud, con la educación, con la información... ¿Es muy optimista pedir que no se haga esto con la investigación? Por otro lado, ¿qué hubiera pasado si se hubiera patentado la rueda, el fuego o la agricultura? Igual hemos llegado a un punto que de evolucionados que somos, no evolucionamos más.

ABAI II. T3: Fraude científico

Aunque ya he comentado algo sobre el fraude científico en alguna de las entradas anteriores, esta tercera tarea del curso está centrada de nuevo en este tema. Concretamente, consiste en buscar un artículo de mi disciplina donde se haya cometido este tipo de mala práctica y comentarlo.

En primer lugar, no ha sido fácil buscarlo porque estoy acostumbrado a precisamente evitar este tipo de artículos en mis búsquedas de información. Leyendo las entradas relacionadas con esta tarea me he encontrado con el término "retracción". Aunque ya lo conocía, me ha dado la idea de buscar artículos de mi disciplina retractados y he dado con una base de datos con todos ellos. He filtrado por mi disciplina y he dado con uno que me ha parecido curioso por dos motivos que voy a explicar en esta entrada.

Se trata de un artículo publicado en la conferencia "International Conference on Machine Learning for Cyber Security" celebrada en 2019. El "proceedings" de esta revista fue publicado por la editorial Springer y el artículo retractado tiene como título: "A Cooperative Placement Method for Machine Learning Workflows and Meteorological Big Data Security Protection in Cloud Computing".

Primero me gustaría destacar que está publicado por la editorial Springer, que es una de las más importantes. Con esto quiero decir que no por estar publicado en una u otra editorial la calidad del artículo está asegurada al 100%. Es cierto que al ser una editorial con tanta cantidad de publicaciones puede ser "entendible" que se les cuele algún artículo de dudosa calidad.

He escogido este artículo, aparte de por estar relacionado con mi disciplina (machine learning y cloud computing), porque las razones para su retirada son cuatro: errores en los datos, errores en el método, errores en los resultados y errores en las conclusiones. Viendo esto he creído que sería interesante comentarlo, ya que una de las entradas de la tarea habla de los distintos tipos de errores y de si tienen o no "mala fe".

Personalmente podría entender que alguien cometiera errores en la captura de los datos (en el procedimiento) y estos no fueran válidos para la experimentación. En este caso supongo que en la propia revisión podrían pedir que se repitiera esta extracción de los datos. También sería entendible, desde mi punto de vista, que hubiera algún error mínimo en la hipótesis o en el desarrollo de la teoría. Aunque esto es algo más serio, podría ser subsanado también en la revisión. Por último, los resultados pueden estar mal interpretados por parte de los autores y cometer errores en la extracción de conclusiones. Dándose alguno de estos casos, podría entender que se trata de errores por descuido o por falta de cuidado de los autores, pero en el caso del artículo comentado no me parece que sea debido a un despiste, ya que han cometido en cada una de las etapas de la investigación.

También me llama la atención que existiendo errores en casi todos los procesos de la investigación (datos, método, resultados y conclusiones), haya sido capaz de pasar por la revisión por pares y no ser rechazado.

Dicho esto, me gustaría terminar planteando una pregunta: ¿Es la retirada de un artículo un fracaso de la revisión por pares en la revista? No creo que todas las "retractions" sean un error en el proceso de revisión por pares y tampoco quiero quitar responsabilidad a los autores que han cometido estos errores, pero me parece que este es un ejemplo claro de retirada de un artículo por una revisión por pares muy pobre.

ABAI II. T2: El paradigma del tráfico de internet

En esta segunda tarea voy a escribir sobre un paradigma importante de la disciplina sobre la que estoy haciendo la tesis. Como la ingeniería de telecomunicación es una disciplina muy amplia, he pensado centrar esta entrada en la telemática, que es la especialidad sobre la que estoy haciendo la tesis.

Al ser esta especialidad relativamente nueva, se han producido muchos avances en los últimos años. A mi me gustaría comentar uno que me parece especialmente interesante aunque puede parecer que no tiene tanta relevancia como otros.

Se trata de la autosimilitud del tráfico Ethernet. Este nuevo paradigma fue enunciado en este artículo en 1993, aunque fue corregido y ampliado en otros posteriores. Consiste en la demostración de que el tráfico Ethernet en una red no sigue un modelo de llegadas de Poisson (como se creía hasta entonces) sino que tiene llegadas "a ráfagas" y tiene la propiedad de autosimilitud. Es bastante complejo para explicarlo en una entrada de un blog pero básicamente esta propiedad se basa en que las llegadas tienen la misma forma aunque modifiques la escala de tiempo en la que las observas.

Figura 1. Gif que representa la propiedad de autosimilitud.

Esta imagen que he encontrado creo que sirve para entender mejor la propiedad que comentaba. Si tienes representadas en el tiempo las llegadas de paquetes en una red Ethernet, aunque amplies o disminuyas la escala de tiempos (eje X), las llegadas mantendrán la misma forma. Como digo, puede que parezca que no es un descubrimiento demasiado importante, pero tenemos que entender que estos modelos sirven para dimensionar muchos (por no decir todos) los equipos que actualmente nos dan servicio de acceso a la red global. El problema que había con el modelo antiguo (de llegadas de Poisson) que se había mantenido del modelado de llamadas telefónicas, era que no conseguía predecir bien el tráfico y no se podía utilizar para el dimensionamiento de las redes. Con este nuevo paradigma de la autosimilitud, se puede modelar de una forma más correcta el tiempo entre llegadas de paquetes y de esta forma dimensionar los equipos de la red para que todo el mundo pueda acceder.

Tal vez haya quedado todo muy abstracto pero a mi siempre me ha llamado la atención este tema y me parece un buen ejemplo de paradigma para comentar. Sobre todo porque toda la comunidad daba por bueno el modelo anterior de las llamadas telefónicas y no se planteaban que hubiera un problema con la modelización hasta que se descubrió que no se podía mantener este modelo, había que actualizarlo.

ABAI II - T1: Papel social de mi tesis

Hola de nuevo, volvemos con la primera tarea del curso de ABAI II. En esta entrada comentaré el papel social de mi disciplina en general y de mi tesis en particular.

Conviene recordar de la primera entrada en este blog el tema de mi tesis que no es otro que analizar la posibilidad de detectar un tipo de malware (ransomware) a partir del tráfico encriptado entre un cliente y un servidor de contenidos en red.

Comenzaré comentando el impacto social de mi disciplina en general. Aunque soy ingeniero de telecomunicación, este campo es muy amplio y tiene una repercusión muy elevada que creo que no hace falta destacar. Yo quería centrarme en la disciplina en la que me especialicé y sobre la que versará mi tesis: la telemática. Aunque también es un campo bastante amplio, se centra en el estudio de las comunicaciones a través de internet (análisis de tráfico, detección de amenazas, estudio de nuevos protocolos, etc). Creo que en los tiempos actuales es una disciplina con mucho impacto social ya que la mayoría de la sociedad tiene acceso y utiliza servicios a través de internet diariamente. Es importante la investigación en este tema para poder ofrecer y desarrollar estos servicios de forma segura y día a día más eficientemente.

En cuanto al impacto social de mi tesis en particular, creo que es también bastante elevado (o eso espero). En los últimos años se ha producido una expansión bastante importante de los servicios online y "en la nube" que permiten que los usuarios accedan a contenidos almacenados en servidores centralizados tanto en las propias empresas como a nivel personal con servicios como Dropbox o Google Drive. El tipo de malware que voy a intentar detectar en mi tesis tiene un efecto muy importante (dañino) sobre todo en este tipo de servicios online. En cuanto a las empresas, que un único usuario con el malware pueda ser capaz de cifrar todos los archivos de los servidores de la empresa supone un problema evidente (todos recordamos el caso de Telefónica en el 2017 o el de la Cadena Ser hace unos meses). También me gustaría añadir que los nuevos ransomware que están apareciendo en las últimas semanas están centrando el blanco en servicios sanitarios como hospitales y/o ambulatorios, así que aunque para esta vez los resultados de mi tesis no van a llegar a tiempo, se puede ver que es un tema de investigación muy necesario.

Con esto termino esta primera tarea de ABAI II, ojalá esté en lo cierto y, aunque mi tesis por sí sola no tenga un gran impacto social, ésta sea un granito de arena más que aporte nuevos conocimientos y ayude a otras investigaciones en la detección del ransomware en particular y el malware en general.

T5. Comunicación no formal, divulgación.

Para esta última tarea del curso de ABAI-I toca hablar (o escribir) sobre divulgación científica. Es un tema interesante y muy necesario en la actividad investigadora en el que además, muchas veces, fallamos los investigadores. Tal vez por no darle la importancia que merece o porque nos centramos mucho en los aspectos técnicos, algunas veces me sorprendo de leer sobre proyectos muy interesantes en lugares más "escondidos" que otros que no tienen tanta importancia y llegan a los medios más conocidos y visitados.

En relación a las preguntas que se mencionan para la tarea, he decidido contestar a dos de ellas para luego poder escribir una pequeña conclusión personal sobre el tema y que no quede una entrada demasiado larga.

1.- ¿Hay redes sociales específicas de científicos? ¿Tienes perfil en ellas? ¿Por qué?

Sí, sí que las hay. Personalmente conozco y utilizo con frecuencia ResearchGate. En otras como Mendeley tengo perfil pero no las utilizo tanto. En el caso de ResearchGate la utilizo porque me facilita la tarea de mantenerme al tanto de lo que se trabaja en mi campo. Yo sigo a varios autores que trabajan en temas relacionados con el mío y además la propia red social me recomienda artículos que pueden ser de mi interés (y suele acertar).

Con esto no quiero decir que esta sea la única manera de mantenerme al día. Lógicamente hay muchas publicaciones que no llegan a ResearchGate y por supuesto tengo que revisar en otros sitios (Scopus, IEEExplore, etc) pero me gusta ResearchGate porque entro sin buscar nada específico y muchas veces me llevo sorpresas agradables en forma de artículos interesantes. Facebook me recomienda vídeos de recetas de postres y researchGate papers de ransomware, cada cosa en su momento le sirve a uno para echar el rato.

2.- Tras mantener el blog de la asignatura y a la vista de la información de este tema ¿crees que te sería muy costoso mantener un blog sobre los avances de tu tesis?

Creo que sería muy interesante mantener un blog o algo similar con los avances de la tesis. Aparte de por la propia divulgación, que es un aspecto muy positivo, también creo que me vendría muy bien a nivel personal porque me ayudaría a estructurar un poco el trabajo y a analizar los avances.

Creo que no me sería tan costoso porque los temas de cada entrada los elegiría yo mismo. Cada semana podría escribir sobre algo de lo que he leído o de los avances de mi tesis simplemente, y eso facilita mucho el trabajo. Lo que no sé es si le interesaría a alguien!

Conclusiones

El tema de la divulgación me parece clave a la hora de hacer ciencia. Aquí se ha hablado de la divulgación que podemos hacer cada uno de nosotros (sobre nuestro trabajo por ejemplo), de amplificarla y ofrecerla al mayor número de personas posible. Pero, ¿qué pasa cuando esa divulgación sobre nuestro trabajo llega a hacerse por terceras personas?. Estoy pensando en que a la hora de comunicar nuestro trabajo, puede darse el caso de que medios de comunicación se hagan eco de la investigación y caigan en sensacionalismos e incluso en fallos a la hora de explicar aspectos técnicos. Creo que esto último no se podría catalogar como divulgación científica ya que su finalidad principal no es divulgar sino informar.

Simplemente es una reflexión que quería hacer para terminar porque no he podido dejar de pensar durante la tarea que, a veces, por mucho que te esfuerces en hacer una buena divulgación de tu trabajo, luego esta se puede ver "intoxicada" si consigue tener relevancia y que ciertos medios informen sobre ello.

Nos vemos en ABAI-II!!

Taller de creatividad

El día 13 de Febrero asistí al taller de creatividad que organizaron Cristina y Vanesa, de Exprimento Limon y en la que participó Miren Doiz. Personalmente estuve muy a gusto, en un ambiente distendido y diferente al que estoy acostumbrado. Me pareció muy interesante.

Las organizadoras nos dieron a cada uno dos conceptos (al azar) y teníamos una serie de materiales con los que trabajar y representar los dos conceptos. A continuación voy a explicar brevemente mi "obra" a partir de los conceptos que me tocaron.

Método y punto

Al ver método me pareció que no estaba mal, ya que personalmente me considero una persona metódica, me gustan las cosas que siguen un orden. El otro concepto era "punto", y este no me gustó tanto. Me dí un paseo por la zona de los materiales pensando en los conceptos que me habían tocado y valorando las posibilidades que tenía con lo que había allí (cajas de leche, bombillas, teléfonos, hueveras, latas, cajas, etc).

Tras mucho pensar decidí hacer lo siguiente:

Foto de la obra con los conceptos "método" y "punto".

Las formas cuadradas representan la rigidez del método. El concepto "punto" puede entenderse como que el método es el punto de partida de la investigación científica. Quise representar cómo el método puede a veces limitar las investigaciones porque no somos capaces de ver más allá de aquello que parece que "tenemos" que hacer. A medida que avanza la investigación es necesario abrir la mente (representado por la apertura de las cajas) salirse en algún momento del método que parece que debemos seguir y explorar nuevas ideas.

Dado que las cajas representan el transcurso de la tesis, quise aportar un toque de humor y clavar esos pinchos queriendo representar las dificultades a las que nos enfrentamos estos 3 o 4 años. Esos pinchos podrían representar desde la escasez de becas y de su cuantía, hasta el rechazo de publicaciones en revistas.

Método, punto y simetría

Si hubiera sabido desde el principio que iba a tocarme después simetría habría hecho distinta la obra, pero como no lo sabía, lo que intenté fue aportar simetría a lo que ya tenía sin cambiar demasiado el original. Simplemente realicé cortes simétricos en algunas de las cajas.

Foto de la obra añadiendo el concepto de simetría

Concepto de "método" en la obra de un compañero

Foto de la obra de mi compañero

Para añadir el concepto de método a la obra que se ve en la imagen, lo que hice fue añadir con papel de aluminio un "camino" circular comenzando de la "B" situada en la parte inferior y terminando en el circulo central. Con esto quise representar el método como el camino que se puede (¿debe?) seguir (aunque no tiene por qué ser cerrado, como he representado en la obra anterior) en un proceso de investigación en el que se van consiguiendo pequeños objetivos (círculos en la imagen del compañero).

Conclusiones

Actividad muy interesante con la que disfruté más de lo que pensaba. Se podría decir que superó mis expectativas. Debo admitir que el tema del arte siempre me ha costado entenderlo. Debe ser porque a mi me cuesta mucho expresar cosas tan abstractas con cosas sencillas como las que nos dieron.

Aún así fue un ejercicio muy interesante al que mereció la pena asistir. Creo que viene bien hacer cosas distintas que nos obliguen a salir de nuestra zona de confort y a ver las cosas con otra perspectiva.

T4 - Referencias y gráficas

En esta tarea he escogido el ejercicio T4a. Me parece que puede ser más útil analizar un artículo de mi disciplina ya que puede servirme cuando tenga que escribir uno yo. Concretamente, voy a aprovechar para analizar un artículo que tengo pendiente de leer y que tiene como título "Detecting crypto-ransomware in IoT networks based on energy consumption footprint" [1]. Como mi tesis va a tratar de detectar este tipo de malware, tengo que mantenerme al día con las últimas publicaciones sobre el tema.

En total tiene 44 referencias, que se concentran sobre todo en las dos primeras páginas del artículo. En el campo de la ingeniería (al menos) es habitual que se concentren en la introducción y en la sección de "estado del arte", si es que la hay.

En este artículo hay 30 referencias en la introducción utilizadas sobre todo para reflejar la importancia del problema. En mi opinión es importante dejar claro desde un primer momento que los resultados de tu investigación solucionan un problema que existe y afecta a un gran número de personas o empresas. Para esto es necesario citar a otros autores que han mencionado el problema que vas a tratar. En este caso además del problema del ransomware, el autor destaca que hay otros autores que, como él, se han basado en el consumo de energía para la detección. También menciona, y cita artículos para justificarlo, que los entornos de IoT (Internet of Things) están creciendo y pueden ser una "presa fácil" para este tipo de malware.

A continuación viene la sección de Estado del arte, con 14 referencias. La mayoría son herramientas de detección de ransomware con distintas técnicas que el autor explica brevemente y critica o de las que saca algún defecto para justificar que el problema del ransomware sigue vigente y sin solucionarse. Como el autor ha presentado el problema en la introducción, en esta sección justifica que no se ha solucionado a pesar de que muchos investigadores lo han intentado. En este caso particular el problema no se ha solucionado para el entorno concreto que aborda el artículo (no se basa tanto en criticar otras herramientas como en destacar que no se pueden aplicar al escenario de IoT).

En las siguientes secciones hay menos referencias. Alguna en la sección de metodología, ya que utiliza ecuaciones y técnicas desarrolladas o presentadas por otros autores. En las sucesivas ya no hay más referencias, ya que pasa a explicar sus experimentos, sus resultados y sus conclusiones del trabajo.

En general ha sido un buen artículo para este análisis, ya que se ciñe bastante a la estructura estándar de los artículos (IMRAD) y la distribución de las referencias ha sido tal y como me la esperaba y como había visto en otros artículos de la temática.

[1] Azmoodeh, A., Dehghantanha, A., Conti, M. et al. Detecting crypto-ransomware in IoT networks based on energy consumption footprint. J Ambient Intell Human Comput 9, 1141–1152 (2018). https://doi.org/10.1007/s12652-017-0558-5

T3 - Comunicación científica

Después de los textos leídos durante esta tarea, no me cabe ninguna duda de que la comunicación es tan importante o más que los propios resultados de la investigación. Pero, ¿cómo va a ser la comunicación de los resultados más importante que los propios resultados?. Según lo veo yo, y después de haber leído los textos asociados a esta tercera tarea, no comunicar los resultados o comunicarlos de forma errónea es equivalente a no tener estos resultados. A veces incluso es peor, ya que comunicarlos de forma errónea (sin que estos sean reproducibles, por ejemplo) puede hacer a otros investigadores pensar que estos resultados han sido "trucados" y que no es posible obtenerlos honradamente (lo cual es peor que pensar que no existen).

En cuanto a otros tipos de formas de comunicación, en el año que llevo contratado como ayudante de proyecto, me ha tocado ir a dos congresos internacionales y puedo asegurar que los artículos que son presentados con una mala estructura o de forma muy densa, son muy difíciles de seguir y complican la comprensión a la audiencia, que no presta atención a los resultados y por tanto en muchas ocasiones no se aprecia su importancia real.

Personalmente me ha gustado el capítulo 2 de la primera lectura, que es el repaso histórico por las distintas formas de comunicación científica. Siempre me ha gustado la historia, me impresiona cómo se las ingeniaban hace más de mil años para divulgar los descubrimientos.

También me gusta la definición que se da de "paper" tanto en la lectura 1 de la primera entrada como en la tercera. Las cuatro características fundamentales de los artículos me parecen muy interesantes y por supuesto muy necesarias. Me llama la atención que se considere una característica fundamental "estar a la disposición de la comunidad científica sin restricciones" y que a su vez las revistas (o al menos las que yo conozco) requieran inscripción a las mismas (de pago) o abonar una cantidad de dinero para hacer el artículo abierto al público. Las revistas que velan porque sus artículos cumplan las otras tres características fundamentales incumplen de manera flagrante la cuarta. Esto sin más, mi reflexión particular para el que la quiera.

En cuanto a la revisión por pares (peer review), ya la conocía pero he reflexionado sobre ella con las lecturas de la cuarta entrada. Aunque por supuesto que tiene sus problemas, no me parece un mal sistema siempre que se haga desde la honradez (aquella de la que hablaba en la entrada anterior referida a la realización de experimentos). Yo, que muchas veces peco de ser demasiado confiado, no puedo entender cómo un revisor puede rechazar o criticar un artículo por razones como 'robarle' el trabajo. No tengo experiencia enviando artículos pero espero que habitualmente los revisores se centren en las características del propio artículo (o de la investigación) para aceptarlo o rechazarlo.

Por supuesto que el sistema es mejorable, una buena solución me parecería la que he leído de publicar las revisiones de forma que otros científicos juzguen si son o no justificadas. Manteniendo el anonimato de los revisores, me parece que es algo que podría ayudar a hacer estas revisiones más justas.

Esto es todo sobre la tarea 3. Muy interesante y útil para reflexionar sobre estas cosas y para desconectar de tanto trabajo "técnico".