Documento sin título
Ciencias Holguín,                   Revista trimestral,               Año XX, octubre-diciembre 2014

Introducción a los canales RSS como método de publicación y obtención de contenidos / introduction to RSS channels as a content gathering and publishing method 

Roland Rodríguez-Romero. roland@ciget.holguin.inf.cu
Yamén Gustavo Márquez- Hechavarría yamen@ciget.holguin.inf.cu
Eduardo Enrrique González-Anazco eduardo@ciget.holguin.inf.cu
Jorge Ricardo-Góngora jorge@ciget.holguin.inf.cu

Institución de los autores
Centro de Información y Gestión Tecnológica de Holguín

PAÍS
: Cuba     

RESUMEN

Aborda las cuestiones generales en relación con la publicación de contenidos mediante canales RSS como un método novedoso para distribuir contenidos en Internet que permite a los usuarios recibir información de su interés sin necesidad de localizarla navegando por infinidad de sitios y para los proveedores de información constituye una herramienta para diseminar su información, fidelizar usuarios y atraer nuevo visitantes a sus sitios Web. Se discuten además los conceptos generales relacionados con ella y las formas de empleo de la misma.
PALABRAS CLAVE: PUBLICACION de INFORMACION; RSS; Internet.

ABSTRACT

It addresses general issues relating to content publishing by using RSS channels as a novel method for distributing information on the Internet. It allows users to receive information of interest without browsing across countless websites, and for information providers it is a tool for disseminating information, to fidelize their users and to attract new visitors. General concepts related and methods of use, are also discussed.
KEY WORDS: INFORMATION PUBLISHING; RSS; INTERNET.

INTRODUCCION  
En los últimos años se ha producido una revolución a nivel internacional en relación con el acceso a la información. Herramientas tan poderosas como la Internet han facilitado la conexión de millones de personas a distintas fuentes de información de diversa naturaleza. Pero esto no ha quedado allí. De conjunto con esto, se ha producido una avalancha en lo referente a publicación de contenidos, debido principalmente a las facilidades que brinda este medio, tanto técnicas como económicas, para que cualquier persona que lo desee publique prácticamente cualquier tipo de contenido en la red.

Es decir, en estos momentos la publicación de información no está restringida a grandes empresas o a agencias noticiosas reconocidas. Esto ha provocado un crecimiento exponencial en la cantidad de contenidos que aparece diariamente en Internet y la consiguiente saturación de los usuarios de esta información, a los que le resulta cada día más difícil procesar tantos recursos e incluso, poder distinguir aquel que resulte realmente útil y confiable.

De este hecho ha surgido la necesidad de contar con herramientas que alivien la situación, que apoyen la difícil tarea de obtener, filtrar y organizar la información necesaria para cualquier individuo u organización, del gran torrente de contenido en que se ha convertido la red de redes. Los RSS han surgido como respuesta y constituyen una variante interesante en el intento por resolver este problema.  En este artículo se brinda una introducción a esta tecnología, sus conceptos principales y las distintas formas de uso no solo por los usuarios de la información, sino además por los productores de contenido, quienes también pueden apoyarse en esta técnica para hacer más fácil el quehacer cotidiano a sus respectivos usuarios.

MATERIAL Y METODO
Se utilizó el método de análisis y síntesis. La búsqueda de información y al análisis documental y de información.
Además se empleó el método descriptivo para posicionar al lector en el objetivo del tema que se aborda, el Real Simple Sindication (RSS)

RESULTADOS DEL TRABAJO

Nociones básicas sobre los RSS

El Real Simple Sindication (RSS) es un formato de publicación de información basado en XML, donde se especifican los datos fundamentales de los ítems informativos que, de forma paralela, se han publicado en un sitio Web. Es decir, un sitio Web publica noticias, artículos u otro contenido y de forma paralela publica un fichero RSS que contiene los datos básicos y los resúmenes de aquellas informaciones, incluyendo para cada una de ellas un enlace que permita al lector del RSS localizar la información original.

En estos momentos un gran porciento de los sitios en Internet de publicación de noticias, artículos científicos, etc., hacen un uso intensivo de la publicación mediante RSS, como forma de lograr una mayor difusión de sus contenidos. Cualquier sitio Web que publique nuevos contenidos con una cierta regularidad es un candidato perfecto para emplear los RSS.

Por lo general, los canales RSS se identifican en los sitios Web que los contienen por un icono de color naranja, que contiene las iniciales RSS o XML.

Este formato ha sido diseñado para contener la información básica de los ítems informativos que se incluyen en él de manera que esta información pueda ser procesada por ordenadores. De esta manera, al obtener un fichero RSS desde Internet, una computadora puede realizar cualquier procesamiento que pueda programarse sobre dicha información, incluyendo definición de palabras claves, categorización, mostrarla visualmente con un formato nuevo preconcebido, incluirla en boletines electrónicos, etc.

De ahí la utilidad de esta técnica, que permite a los usuarios apoyarse en diversas herramientas que ayuden en el procesamiento de la información, sin que exista la necesidad de navegar por distintos sitios Web para obtener la información que se desea. Basta con “suscribirse” a los canales RSS deseados para recibir de forma automática la información que aquellos contienen. Es importante destacar el hecho de que el RSS no fue diseñado para ser leído por las personas. Aunque puede ser comprendido, para esto es necesario un cierto nivel de conocimientos técnicos sobre su naturaleza. 

Existen varias versiones del formato RSS, algunas de las cuales permiten incluir marcadores de información personalizados para aquellos casos en que sean necesarios. Normalmente se usan dos formatos principales en la publicación de contenido en Internet, que son el RSS 0.9x y el RSS 1.0. Existen también módulos adicionales para la personalización de estos formatos.

Uno de los más conocidos es el Dublin Core.  Este no es más que un conjunto de metadatos desarrollado por bibliotecarios y científicos de la información que estandariza los marcadores empleados para describir documentos.

¿Cómo es un fichero RSS?

A continuación se muestra un ejemplo de un código RSS para dar una idea de la estructura de este tipo de fichero.

Ejemplo de RSS tomado del portal de Infomed

<?xml version="1.0" encoding="ISO-8859-1"?>
<!-- generator="FeedCreator 1.7.2" -->
<rss version="0.91">
   <channel>
        <title>Infomed - Presentación de libros</title>
        <description>Portal de Infomed</description>
        <link>http://www.sld.cu/sitios/ecimed/</link>
        <lastBuildDate>Fri, 16 Nov 2007 11:42:29 -0500</lastBuildDate>
        <generator>FeedCreator 1.7.2</generator>
        <item>
            <title> Terapia Intensiva (Tomo II) </title>
            <link>http://www.sld.cu/sitios/ecimed/</link>
            <description>Libro de texto destinado a los profesionales de las UCI.</description>
             <pubDate>Fri, 16 Nov 2007 11:42:29 -0500</pubDate>
        </item>
    </channel>
</rss>

En este caso se trata de un RSS construido con el formato 0.91. Posee varios marcadores informativos orientados al control de versiones, etc. y un grupo de marcadores que son los que nos interesan desde el punto de vista de captura de información. Estos marcadores de interés se encuentran agrupados dentro del marcador <channel>. Algunos de ellos son los siguientes:

<title> Se refiere al titulo del canal RSS. En este caso es “Infomed – presentación de libros”.

<description> Es una pequeña descripción del canal RSS y su contenido.

<link> Es la dirección en Internet del canal RSS. En este caso es http://www.sld.cu/sitios/ecimed/ . ¡Pruebe a conectarse!.

<lastBuildDate> Es la fecha y hora de creación del fichero RSS.

<item> Es la unidad de información. Cada marcador <item> contiene una unidad de información de las que se publica en el RSS. En esta caso existe solo una, pero pueden ser tantas como se deseen incluir para su publicación.

Cada marcador <item> contiene a su vez a varios marcadores que nos brindan la información publicada. En este caso se tienen los siguientes:

<title> Es el título del ítem.  En este caso es “Terapia Intensiva (Tomo II)”.
<link> La dirección en Internet de la información original.

<description> Una descripción o resumen de la información publicada. Normalmente puede ser un resumen de una noticia o artículo.

<pubDate> La fecha de publicación de la información original.

Estos marcadores pueden variar en cierta medida entre un formato RSS y otro, pero existe un conjunto estándar que es utilizado en todos los formatos y que puede utilizarse para lograr una cierta compatibilidad cuando se trata de procesar un gran número de fuentes RSS.

¿Cómo se utilizan los RSS?
Para una mejor comprensión se divide la explicación sobre el empleo de los canales RSS  en dos partes: su empleo para obtener información y su uso para publicar contenidos, es decir, la publicación de RSS. El presente artículo se centra en el uso de los RSS por parte de las personas (siempre apoyadas por determinado software) y no por parte exclusivamente de las máquinas, las cuales pueden, como ya se mencionó, hacer un uso intensivo de estos para el procesamiento de información.

Obtención de información con canales RSS

Lo primero para poder obtener nuevos contenidos con la ayuda de canales RSS es localizar los canales que son de nuestro interés. Esto puede lograrse directamente, al visitar un sitio en Internet cuyo contenido nos resulte útil, buscando si dicho sitio publica en formato RSS. Otra vía es visitando directorios de canales RSS y localizando allí aquellos que nos pudieran interesar. Finalmente, se pueden localizar también sencillamente haciendo una búsqueda en Internet sobre el tema de interés y adicionando a las palabras claves que se especifiquen el término “RSS”.

En el caso de Google, que es el directorio más visitado en Internet, basta con especificar la palabra de búsqueda y adicionar el término “filetype:rss” para indicarle que en el resultado de la búsqueda se quiere obtener exclusivamente las direcciones de ficheros RSS.

Una vez localizados aquellos canales RSS de interés, se deben registrar en un programa conocido como “agregador”. Los agregadores son aplicaciones que se encargan de conectarse con los canales RSS que se las ha especificado y obtener la información para mostrarla al usuario. En general presentan funcionalidades para facilitar su empleo, como puede ser unir contenidos procedentes de distintos canales, ocultar información que ya el usuario ha visto anteriormente y catalogar los canales y los contenidos.

Existen diversos tipos de agregadores. Pueden ser aplicaciones independientes para distintos sistemas operativos, plug-ins para navegadores o sistemas basados en Internet. Incluso existen agregadores para teléfonos móviles. En el anexo 1 se brinda información sobre estos sistemas.

Publicación de contenidos con canales RSS

La publicación de contenidos empleando canales RSS consiste básicamente en crear el fichero RSS con la información deseada e incluirlo en el sitio Web, de manera que los visitantes puedan obtenerlo y suscribirse a  él,  si así lo desean.

La creación del fichero RSS puede realizarse de muchas maneras y en esto influye la naturaleza del sitio Web donde se va a publicar. Si el sitio Web incluye solamente páginas HTML, es decir, si es un sitio Web estático, será necesario emplear alguna herramienta para crear el fichero RSS. Si es un sitio Web dinámico, desarrollado en lenguaje PHP, .NET o Java, entonces, además de la opción de usar herramientas externas, se puede programar la generación del fichero RSS usando el mismo lenguaje con el que se ha desarrollado el sitio. Esta forma de hacerlo tiene la ventaja de que dicho fichero se puede generar de manera dinámica cada vez que un visitante lo solicita, a partir del contenido de las bases de datos del sitio. De esta forma, nuestro fichero RSS se mantendrá siempre actualizado con los últimos contenidos añadidos a nuestro sitio Web.

Una vez que se ha creado el fichero RSS, se debe  incluir en el sito Web y adicionar un enlace al mismo. Este enlace debe contener alguno de los íconos que identifican a estos ficheros para que resulte fácil a los visitantes encontrarlo. Adicionalmente se puede incluir un marcador que indicará a los navegadores que la página que se está visualizando contiene un enlace a un fichero RSS. Este se incluye normalmente en la sección <head> de la página Web. A continuación se muestra un ejemplo del formato que debe tener este marcador:

<link rel="alternate" type="application/rss+xml" href="feed.rss" title="Mi RSS">

En el anexo 2 se muestra un directorio de herramientas para la creación de ficheros RSS.

CONCLUSIONES

1. La información brindada en esta labor es una introducción general al trabajo con la tecnología RSS.
2. Constituye una base mínima suficiente para comenzar a implementar esta técnica en aquellos sitios Web que lo deseen.
3. Es un modo de publicación de contenidos, que ha alcanzado gran auge por lo que se considera necesaria su socialización.

RECOMEDACIONES
Que este resultado sirva de punto de partida para lograr un aumento en el número de sitios y portales Web en nuestro país que emplean esta técnica, lo que puede influir positivamente en lograr un incremento importante en la visibilidad y cantidad de visitas alcanzadas por nuestro contenido publicado en Internet.

BIBLIOGRAFIAS


ANEXO 1 -  Pequeño directorio de herramientas para el procesamiento de canales RSS.


ANEXO 2 -  Pequeño directorio de herramientas para la creación de canales RSS.

  • RSSxpress. Sistema basado en web para la creación de canales RSS en formato 1.0. Disponible en http://rssxpress.ukoln.ac.uk/

  • RSS Channel Editor. Sistema basado en web para la creación de canales RSS en formato 0.91. Disponible en http://www.webreference.com/cgi-bin/perl/rssedit.pl

  • MyRSS. Este sitio brinda un servicio de “scraping”, que consiste en crear canales RSS a partir de códigos HTML ya existentes. Los RSS resultantes pueden ser de baja calidad a no ser que se incluyan en el código HTML marcadores especiales para apoyar al sistema en la generación del canal RSS. Disponible en http://myrss.com/

  • Redland. Programa para validar canales RSS en formato 1.0. Dispoible en http://www.redland.opensource.ac.uk/rss/

  • RSS Validator. Programa para validar canales RSS en formato 0.91, 0.92, 0.93, 0.94, 1.0 y 2.0. Disponible en http://feeds.archive.org/validator/

 

Síntesis curricular de los Autores
  Lic. Roland Rodríguez-Romero roland@ciget.holguin.inf.cu.Licenciado en Ciencia de la Computación por la Universidad de Oriente, Cuba. Se desempeña actualmente como especialista en ciencias informáticas. Ha cursado el diplomado de "Matemática e Informática Aplicada a la Administración" y otros posgrados afines. Ha participado en varios proyectos de investigación y desarrollo (I + D). Su área de investigación se encuentra alrededor de la gestión de información.
 
Lic: Eduardo Enrrique González-Anazco eduardo@ciget.holguin.inf.cu.Licenciado en Ciencias de la Computación en Universidad de Oriente, actualmente se desempeña en el grupo de desarrollo de sosfware de la institución, tiene habilidades en Diseño y análisis de algoritmos.
  Conoce lenguajes de programación como: HTML, Java Script, CSS, ExtJs 3, Action Script 3, PHP, Doctrine y C++. Desarrollo con el framework de PHP Symfony 1.4. Desarrollo con el framework de Js ExtJs 3.

Ing. Yamén Gustavo Márquez-Hechavarría.
yamen@ciget.holguin.inf.cu.
Ingeniero Industrial. Presidente del Consejo Técnico Asesor. Lidera el Proyecto Institucional “Diseño de un sistema de gestión de la calidad con soporte de aplicaciones informáticas en el CIGET, Holguín”. Ha participado en eventos de base, municipales y provinciales. Desarrolla su tesis de maestría en Ingeniería Industrial.

Ing. Jorge Ricardo-Góngora
. jorge@ciget.holguin.inf.cu.Graduado en Ingeniería Informática. Se desempeña actualmente como Administrador de Sistemas del Centro de Información y Gestión Tecnológica de Holguín. Su área de investigación se encuentra alrededor de las redes de telecomunicaciones y sus servicios y aplicaciones.

Institución de los autores.
Centro de Información y Gestión Tecnológica de Holguín

 


Fecha de Recepción: 22 de diciembre 2013
Fecha de Aprobación: 06 de noviembre 2014
Fecha de Publicación: 14 de noviembre 2014

 

© Centro de Información y Gestión Tecnológica de Holguín. Cuba
 (CIGET de Holguín)

Enlaces refback

  • No hay ningún enlace refback.