Buenas tardes Alfredo, yo soy compañera de Adriana el punto es que queremos saber como extraer la información de una pagina web teniendo en cuenta su estructura de tal manera que la podamos analizar con el programa weka o rapid i. O en determinado caso si existe o conoce otro programa que trabaje mineria de estructura web. Pues ya hemos trabajado con el weka y nos genera un error al intentar abrir un archivo xml. El tema central podría ser también como generar un archivo para weka partiendo la e…
Continuar
Añadido por MONICA ANDREA CRISTANCHO RUIZ en septiembre 25, 2009 en 6:30pm —
No hay comentarios
Hola a todos
Ya que una alumna me ha pedido una aclaración sobre puntos de minería de estructura de la web, he decidido realizar este post explicando diferentes conceptos de la misma, empezando por la definición, modelado y uso de las nociones de:
Autoridad (authoritative page), prestigio.
No se quieren sólo localizar un conjunto de páginas relevantes sino que se quieren las páginas relevantes de mayor calidad. Para limitar una búsqueda grande en Internet hasta un tamaño sensato para un…
Continuar
Añadido por Alfredo de la Presa Cruz en septiembre 16, 2009 en 7:59pm —
4 comentarios
Hola de nuevo
Se están empezando a poner de moda los lectores de libros digitales -de los cuales -
tal y como señala en el Mundo Ángel Jiménez de Luis- lo que más duele es la falta de contenidos que hay, así que me he preguntado ¿Qué libro elegiría para descargarme?
En muchas ocasiones he defendido apasionadamente este libro, uno de los mejores que he leído nunca y que nunca deja de sorprenderme:…
Continuar
Añadido por Alfredo de la Presa Cruz en agosto 6, 2009 en 4:49pm —
No hay comentarios
Hola a todos
Como no voy a poder asistir al encuentro de "Inventando la Universidad 2.0" que se celebra este año en la UIMP, y como ya va a hacer un año que se terminó este curso, a modo de onomástica voy a publicar aquí un enlace a una aplicación web llamada Calameo donde se encuentra a disposición de todos ustedes la posibilidad de editar de forma atractiva una revista virtual. A modo de ejemplo he incluido una pequeña descripción de cómo conseguir un curso online "fascinante", extraída de la…
Continuar
Añadido por Alfredo de la Presa Cruz en agosto 6, 2009 en 1:55pm —
No hay comentarios
Hola a todos
Voy a realizar una pequeña prueba con este blog consistente en introducir un documento desde scribd- un repositorio de documentos a ver si la red lo soporta.
El documento que cargaré es un pequeño análisis sobre las Redes Sociales y una pequeña práctica realizada en mi centro educativo.…
Continuar
Añadido por Alfredo de la Presa Cruz en mayo 25, 2009 en 12:30pm —
No hay comentarios
Hola de nuevo
Incluyo a continuación el enlace a la ponencia del profesor Jorge Calandra sobre el uso de Internet en las Matemáticas
Ponencia de matemáticas de Jorge Calandra.ppt
Saludos,
Alfredo de la Presa
Continuar
Añadido por Alfredo de la Presa Cruz en noviembre 19, 2008 en 3:54pm —
No hay comentarios
Hola de nuevo
A continuación incluyo las dos ponencias que sobre el tema : La búsqueda en la Web enunció el profesor Julio Gonzalo.
Primera Ponencia:
julio-gonzalo-primera-ponencia
Segunda Ponencia:…
Continuar
Añadido por Alfredo de la Presa Cruz en noviembre 5, 2008 en 4:13pm —
No hay comentarios
Hola a todos:
Incluyo aquí la ponencia del doctor David Rosado Chacón sobre Internet en la investigación clínica:
Internet en la investigación Clínica.ppt
Saludos,
Alfredo de la Presa
Continuar
Añadido por Alfredo de la Presa Cruz en noviembre 5, 2008 en 3:55pm —
No hay comentarios
Hola de nuevo
A continuación planteo lo que fueron las preguntas tratadas en la mesa redonda Internet y la Ciencia en la actualidad.
Internet y la Ciencia en la actualidad.ppt
Ni que decir tiene que os animo a comentar estas preguntas...
Saludos,
Alfredo de la Presa
Continuar
Añadido por Alfredo de la Presa Cruz en octubre 16, 2008 en 3:29pm —
No hay comentarios
Hola de nuevo
Aquí incluyo la presentación:
Aspectos interesantes de los mundos virtuales 3D.ppt
Espero que sirva también para debatir si realmente ha llegado la hora de estos sistemas o si, como rezaba el título de la mesa redonda, no son sino una visión de futuro.
Saludos,
Alfredo de la Presa
Continuar
Añadido por Alfredo de la Presa Cruz en octubre 16, 2008 en 3:19pm —
No hay comentarios
Hola de nuevo,
Aquí enlazo las diapositivas ponencia de la profesora Elena Bárcena sobre la Mesa de Trabajo del Traductor.
CVerano-UIMP-EBarcena.pdf
Como antes, os animo a debatir la ponencia y a comentarla.
Saludos,
Alfredo de la Presa
Continuar
Añadido por Alfredo de la Presa Cruz en octubre 15, 2008 en 3:33pm —
No hay comentarios
Hola a todos,
Tras el parón debido a mi lectura de tesis de Master Oficial en la UNED, ahora vamos a ir subiendo poco a poco presentaciones de las distintas ponencias del curso y vamos a empezar con la última ponencia, la de Lara Sáiz Presmanes, La Astronomía en Internet
Aquí os la dejo para que la disfrutéis, y lo que es más importante, para que sirva de punto de inicio a un debate sobre las diferentes posibilidades educativas de Internet.…
Continuar
Añadido por Alfredo de la Presa Cruz en octubre 15, 2008 en 3:26pm —
No hay comentarios
Hola de nuevo
La World Wide Web contiene una cantidad enorme de información, pero puede ser extremadamente difícil para los usuarios el localizar recursos que sean de calidad y relevantes a las necesidades de información. Para mejorarlo se han desarrollado algoritmos que explotan la estructura de hipervínculos de la WWW para el descubrimiento de información y categorización, la construcción de listas de recursos de alta calidad y el análisis de las comunidades online enlazadas.
Hay muchas manera…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 22, 2008 en 3:08pm —
No hay comentarios
Hola a todos
Definición y objetivos
La tarea de Extracción Automática de Terminología se usa sobre todo para la construcción de tesauros. Un tesauro es una herramienta para control de vocabulario. Normalmente es diseñado para indexar y buscar en un área de conocimiento específica. Guiando a los indexadores y a los buscadores sobre qué términos usar puede ayudar a mejorar la calidad de la información recuperada. . Así, los propósitos primarios de un tesauro son identificados como promoción…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 22, 2008 en 2:57pm —
No hay comentarios
Hola de nuevo,
Ahora hablaremos de la extracción de información textual
Definición y objetivos.
La creciente disponibilidad de fuentes on-line en formato texto y el número potencial de enfoques de adquisición del conocimiento de datos textuales, tales como la Extracción de Información ha llevado a incrementos en la investigación de extracción de la información, como generar bases de datos de los documentos, así como también la adquisición de conocimiento útil para tecnologías emergentes c…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 20, 2008 en 4:30pm —
No hay comentarios
Hola a todos.
Éste será un breve post sobre los corpus (o corpora en plural)
¿Qué es un corpus?
En lingüística y lexicografía, un corpus es un conjunto de textos, elocuciones u otros especimenes considerados más o menos representativos de una lengua y almacenados usualmente como una base de datos electrónica.
Posibles usos y utilidad de un corpus
La información léxica es usada para diferentes tipos de etiquetado, las taxonomías existentes se usan para etiquetado semántico y se usa…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 20, 2008 en 4:11pm —
2 comentarios
Hola a todos
1.Definición y objetivos del estudio de la dinámica de la web
El uso global y continuo crecimiento exponencial de la web nos plantea una serie de desafíos a la comunidad investigadora. En particular, hay una necesidad urgente de comprender y manejar la dinámica de la web para desarrollar nuevas técnicas que hagan que la web sea tratable. ¿Y qué se entiende por dinámica de la web? Cómo cambia el uso, la topología y el contenido de la información y qué clases de modelos y técni…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 16, 2008 en 4:49pm —
No hay comentarios
Hola de nuevo,
Ahora hablaremos de la búsqueda de información en la web
Características propias de la web que afectan a la búsqueda.
La web es una fuente de información distribuida, dinámica, y rápidamente creciente que presenta dificultades para las tecnologías tradicionales de recuperación de la información, dado que éstas fueron diseñadas para ser usadas típicamente para indexar una colección estática de documentos directamente accesibles. La naturaleza de la web hace que se cuestione…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 16, 2008 en 12:25am —
No hay comentarios
Hola a todos.
Hoy hablaremos de los crawlers
¿Qué es un crawler?.
Un crawler (también conocido como Recolector, Web spider o robot del Web) es un programa que hojea el World Wide Web de una manera metódica, automatizada. Otros nombres usados con menor frecuencia para los crawlers de la Web son hormigas, controladores paso a paso automáticos, bots, y gusanos (Kobayashi y Takeda, 2000). Los crawlers hacen uso de la estructura de grafo de la web para moverse de página a página, mediante una…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 15, 2008 en 9:43pm —
No hay comentarios
Hola a todos
En este post razonaremos cuál es el proceso básico por el que un buscador puede duplicar la capacidad de su índice, y cómo afecta a la velocidad con la que procesa las búsquedas
Introducción
Lógicamente, para saber cómo puede un buscador duplicar la capacidad de su índice, habrá que saber primero qué es un índice, y dado que eso está dentro de la estructura general del buscador, la describiremos y después nos centraremos en su índice, siendo el buscador elegido Google, ya qu…
Continuar
Añadido por Alfredo de la Presa Cruz en julio 12, 2008 en 4:06pm —
3 comentarios