Archivo de la categoría: INTERNET

Investigadores publican enorme catálogo de más de 300.000 galaxias cercanas

Más de 83.000 ciudadanos científicos voluntarios participaron en el proyecto de crowdsourcing (colaboración abierta distribuida) que recopiló esta gran cantidad de información

Más de 83.000 ciudadanos científicos voluntarios. Más de 16 millones de galaxias clasificaciones. La información sobre más de 300.000 galaxias. Esto es lo que se obtiene cuando se le pide ayuda al público para aprender más sobre nuestro universo.

El proyecto, llamado Galaxy Zoo 2, es la segunda fase de una iniciativa de crowdsourcing para clasificar galaxias en nuestro universo. Los investigadores dicen que las computadoras son buenas para medir en forma automática las propiedades como el tamaño y el color de las galaxias, pero en la actualidad las características más difíciles, tales como la forma y la estructura, sólo pueden ser determinados por el ojo humano.

Un grupo internacional de investigadores, dirigido por la Universidad de Minnesota, acaba de elaborar un catálogo de estos nuevos datos de galaxias. Este catálogo es 10 veces más grande que cualquier catálogo anterior de este tipo. Está disponible en línea en data.galaxyzoo.org y un documento que describe el proyecto y los datos fueron publicados esta semana en la revista Monthly Notices de la Royal Astronomical Society.

Vea ejemplos de imágenes clasificadas por ciudadanos científicos en http://z.umn.edu/galaxyimages .

«Este catálogo es la primera vez que hemos sido capaces de reunir tanta información sobre una población de galaxias», dijo Kyle Willett, investigador postdoctoral de física y astronomía en la Facultad de Ciencias e Ingeniería de la Universidad Minnesota, y autor principal del artículo. «Gente de todo el mundo está empezando a examinar los datos para obtener una comprensión más detallada de los tipos de galaxias.»

Entre febrero 2009 y abril de 2010, más de 83.000 voluntarios de todo el mundo del proyecto Galaxy Zoo 2 vieron las imágenes en línea recolectadas por el Sloan Digital Sky Survey. Respondieron preguntas sobre las galaxias, incluyendo si tenía espirales, el número de brazos en espiral presentes, o si tenía barras galácticas, que son rasgos característicos prolongados que representan una concentración de estrellas. Cada imagen fue clasificada un promedio de 40-45 veces para asegurar la precisión. Se reunieron más de 16 millones de clasificaciones de más de 300.000 galaxias, lo que representa cerca de 57 millones de clics de computadora.

Cuando se les preguntó a los voluntarios por qué se habían involucrado en el proyecto, la respuesta más común fue porque los hacía felices contribuir a la ciencia. Los investigadores estiman que el esfuerzo de los voluntarios en este proyecto representa cerca de 30 años de trabajo a tiempo completo de un investigador.

«Con los telescopios de alta potencia de hoy en día, estamos reuniendo tantas nuevas imágenes que los astrónomos no pueden mantener al día con clasificaciones detalladas», dijo Lucy Fortson, profesora de física y astronomía en la Universidad de la Facultad de Ciencias e Ingeniería de Minnesota y una de las co-autoras del trabajo de investigación. «Nunca podríamos haber elaborado un catálogo de datos así sin la ayuda crowdsourcing del público.»

Fortson dijo que Galaxy Zoo 2 es similar a un censo de las galaxias. Con este nuevo catálogo, los investigadores tienen ahora una instantánea de los diferentes tipos de galaxias como son hoy. El próximo catálogo nos dirá acerca de las galaxias en el pasado distante. Ambos catálogos juntos nos permitirán comprender cómo está cambiando nuestro universo.

Para ayudar a crear el siguiente catálogo, se siguen necesitando ciudadanos científicos voluntarios para el proyecto. Para participar, visite www.galaxyzoo.org. No se necesitan habilidades especiales, y los voluntarios pueden comenzar a clasificar galaxias y ayudar a los científicos a pocos minutos de ingresar a la página web.

Además de Fortson y Willett, otros autores del trabajo de investigación son Chris Lintott, Astrofísica de Oxford y Adler Planetarium, Steven Bamford, de la Universidad de Nottingham, Karen Masters, Robert Nichol y Daniel Thomas, de la Universidad de Portsmouth y el South East Physics Network, Brooke Simmons y Robert Simpson, Astrofísica de Oxford; Kevin Casteels, Universidad de Barcelona; Edward Edmondson y Melvin Thomas, de la Universidad de Portsmouth, Sugata Kaviraj, de Astrofísica de Oxford y la Universidad de Hertfordshire, William Keel, de la Universidad de Alabama; M. Jordan Raddick de la Universidad Johns Hopkins; Kevin Schawinski, ETH Zurich, Ramin Skibba de la Universidad de California, San Diego, y Arfon Smith, Adler Planetarium.

La investigación fue financiada principalmente por la Fundación Nacional de la Ciencia y el Leverhulme Trust. Galaxy Zoo es uno de los muchos proyectos de ciencia ciudadana en línea puestos a disposición por el equipo Zooniverse.org.

Para leer el documento completo de investigación titulado «Galaxy Zoo 2: detailed morphological classifications for 304,122 galaxies from the Sloan Digital Sky Survey», visite el sitio web Monthly Notices of the Royal Astronomical Society.

Fuente: Universidad de Minnesota. Aportado por Eduardo J. Carletti

Más información:

Componen un enorme léxico de relaciones entre palabras y emociones en internet

El análisis de sentimientos en la red social depende de cómo se expresan los estados mentales en palabras. Ahora una nueva base de datos de las relaciones entre palabras y emociones podría darnos un mejor punto de partida para este tipo de análisis

Una de las frases más utilizadas en relación con la web social es el análisis de sentimientos. Esta es la capacidad de determinar la opinión o estado mental de una persona analizando las palabras que usan en Twitter, Facebook o cualquier otro medio.

Este método promete muchas cosas: la capacidad para medir el grado de satisfacción con los políticos, las películas y los productos; la capacidad de manejar mejor las relaciones con los clientes; la capacidad de crear diálogo para juegos basados en las emociones; la capacidad de medir el flujo de la emoción en las novelas, y mucho más.

La idea es automatizar completamente el proceso, analizando la avalancha de palabras producidas por los sitios webs sociales usando técnicas avanzadas de minado de datos para poder medir el sentimiento a gran escala.

Pero todo esto depende de nuestro grado de comprensión de la emoción y polaridad (ya sea positiva o negativa) que la gente asocia con cada palabra o combinación de palabras.

Saif Mohammad y Peter Turney del Consejo Nacional de Investigación de Canadá en Ottawa han develado una enorme base de datos de palabras con las emociones y la polaridad asociadas a ellas. Ellos la crearon de una forma rápida y barata usando el sitio web de crowdsourcing de Amazon Mechanical Turk. Afirman que este mecanismo de crowdsourcing sirve para aumentar el tamaño y la calidad de la base de datos de una manera sencilla y rápida.

La mayoría de los psicólogos creen que hay seis emociones básicas —alegría, tristeza, ira, miedo, asco y sorpresa— o un máximo de ocho si se incluyen la confianza y la expectación. Así que la tarea de cualquier léxico de palabras y emociones es establecer con qué fuerza se asocia una palabra a cada una de estas emociones.

Una forma de hacerlo es usar un pequeño grupo de expertos para que asocien emociones con series de palabras. Una de las bases de datos más famosa, creada en la década de 1960, y conocida como la base de datos de General Inquirer, tiene más de 11.000 palabras etiquetadas con 182 etiquetas distintas, incluyendo algunas de las emociones que los psicólogos consideran las más básicas.

Una base de datos más moderna es el Léxico WordNet Affect, que tiene unos cientos de palabras etiquetadas así. Este léxico contó con un pequeño grupo de expertos para que etiquetaran manualmente una serie de palabras «semilla» con las emociones básicas. El tamaño de la base de datos aumentó de forma drástica al asociar automáticamente las mismas emociones con todos los sinónimos de estas palabras.

Uno de los problemas derivados de estos métodos es el tiempo que lleva recopilar una gran base de datos, así que Mohammad y Turney probaron con un enfoque ligeramente distinto.

Estos investigadores seleccionaron unas 10.000 palabras de un tesauro existente y de los léxicos descritos anteriormente, y crearon una serie de cinco preguntas sobre cada palabra que revelarían las emociones y polaridad asociados con ella. Esto supone más de 50.000 preguntas.

A continuación hicieron estas preguntas a más de 2.000 personas o «Turcos», en el sitio web de Amazon Mechanical Turk (Turco Mecánico), pagando 4 centavos de dólar por cada serie de preguntas respondidas correctamente.

El resultado es un léxico completo de palabras-emociones para más de 10.000 palabras o frases de dos palabras que han bautizado EmoLex.

Un factor importante de esta investigación es la calidad de las respuestas que proporciona el crowdsourcing. Puede ser que algunos Turcos contesten al azar o incluyan respuestas erróneas a propósito.

Mohammad y Turney abordaron este problema insertando preguntas en el test que sirven para evaluar si el «Turco» está contestando bien o no. Si no, todos los datos de esa persona se ignoran.

Han probado la calidad de su base de datos comparándola con bases anteriores creadas por expertos y afirman que sale bien parada. «Comparamos un subconjunto de nuestro léxico con los datos estándar existentes para demostrar que las anotaciones obtenidas son de gran calidad», afirman.

Este enfoque tiene mucho potencial para el futuro. Mohammad y Turney afirman que debería ser relativamente fácil aumentar el tamaño de la base de datos y que la misma técnica se puede adaptar para crear léxicos parecidos en otros idiomas. Y todo ello se puede hacer por muy poco dinero, los investigadores solo gastaron 2.100 dólares (unos 1.600 euros) en Mechanical Turk para este trabajo.

La conclusión final es que el análisis de sentimientos solo será tan bueno como la base de datos de la que depende. Con EmoLex, los analistas tienen una nueva herramienta para su caja de trucos.

Ref: arxiv.org/abs/1308.6297: Crowdsourcing un Léxico de Asociación de Palabras y Emociones

Fuente: Technology Review. Aportado por Eduardo J. Carletti

Más información:

Lo que fuimos, lo que seremos

Internet, que es uno de los mayores avances de las últimas décadas, no parecía estar en nuestro futuro más inmediato, y sin embargo, ha democratizado mucho el acceso a la información y los servicios

El otro día me acordé de las famosas zapatillas de deporte que lucía Michael J. Fox en Regreso al Futuro II, de 1989, y de la gran acogida que tuvieron por parte del público en su momento. Miles de fans pedían a la casa Nike que las pusiese a la venta, tarde o temprano, e incluso había quienes lo que deseaban realmente es que la famosa franquicia retuviese el lanzamiento de las mismas hasta el año 2015, que es el tiempo en que se desarrolla la película. Finalmente, en 2012 se lanzaron 1.500 pares de una réplica del par de zapatillas, bajo subasta, con unas cifras impresionantes, sólo accesibles para coleccionistas muy, muy interesados, ya que el primer par fue adquirido por la friolera de 27.000 euros. No esperaron a 2015, pero quedan menos de dos años y el futuro que proponía Robert Zemeckis no parece estar cumpliéndose. Y es que la ciencia ficción a veces es un preludio de lo que seremos, e incluso fuente de inspiración para diseñadores y científicos, y otras veces, podríamos llegar a plantearnos qué fue antes, si el huevo o la gallina, es decir, si los guionistas y escritores de novelas y cómics de ciencia ficción han tenido acceso a prototipos o estudios que demostrasen la viabilidad, con un poco más de investigación, de ciertos conceptos, y es en ellos en los que basan sus historias.

Resulta curioso, por ejemplo, cómo se ha apostado tanto en el cine y la literatura futurista por las telecomunicaciones «cara a cara», es decir, no por los teléfonos móviles con internet, que es lo que hoy día todos tenemos o deseamos tener, sino por grandes pantallas en nuestra casa con las que realizar videoconferencia. Desde hace casi una década nuestros dispositivos móviles ofrecen esa tecnología, y sin embargo, rara vez la utilizamos, incluso desde nuestros ordenadores no solemos emplear por sistema las videoconferencias. De hecho, y volviendo a incidir en el mismo ejemplo de la archiconocida saga de Regreso al Futuro, cuando vemos al padrastro de Marty McFly, Biff Tannen, en su lujoso edificio, aparece jugando al poker, exactamente igual que en la tercera película que se desarrolla en el pasado, en el Lejano Oeste. A nadie se le ocurrió que se pudiesen celebrar partidas de poker online. Internet, que es uno de los mayores avances de las últimas décadas, no parecía estar en nuestro futuro más inmediato, y sin embargo, ha democratizado mucho el acceso a la información y los servicios.

Pasa algo parecido con los medios de transporte, que en la mayor parte de los casos abandonan el suelo para salir volando, pero salvo la fantástica idea de Doc de alimentarlos a base de basura, rara vez se hace mención al salto de la energía fundamentada en combustibles fósiles a la energía eléctrica, que es lo que parece ser, si realmente se acaba apostando por ello, lo que moverá nuestros vehículos en un futuro. Nuestro presente no es ni con mucho el futuro que imaginábamos en los ochenta, y posiblemente, el presente de 2040 nada tenga que ver con lo que ahora reflejamos en nuestras películas futuristas. Seguro que es ese distanciamiento de la realidad lo que hace que nos gusten tanto.

Fuente: Axxón. Aportado por Eduardo J. Carletti

Más información: