Cómo funcionan los buscadores

¿Cómo funciona un buscador como Google?

Cuando hablamos de buscadores casi siempre nos referiremos a Google porque es el que tiene practicante todo el mercado. Pero si te dedicas a mercados locales la cosa cambia:

Búsquedas desde EEUU:

Búsquedas desde China:

Pero independientemente del buscador usado, si quieres dedicarte al SEO el primer paso es entender cómo funcionan los motores de búsqueda para facilitarles su trabajo y que te premien por ello.

¿Cómo funciona un buscador?

Antes de mostrar un resultado en la SERP (página de resultados del buscador), Google tiene que rastrear y luego indexar los billones de páginas que existen en internet. Es decir, antes de rankear o mostrar un resultado, un buscador debe de conocerlo.

A continuación vamos a ver todas las fases del funcionamiento de un buscador para saber cómo podemos hacer que nuestra web sea encontrada por los buscadores y como consecuencia, por las personas.

1# Rastrear

El rastreo, también conocido como crawling, es la primera fase del funcionamiento de un buscador.

En esta fase Google utiliza Googlebot, una serie de robots (programas también conocidos como crawlers o spiders) que van siguiendo los enlaces que hay en las páginas web. Gracias a estos spiders, Google es capaz de encontrar prácticamente todas las páginas que existen.

Si en tu web los enlaces no son accesibles, los buscadores tendrán dificultadas para seguirlos y encontrar todas las páginas de tu sitio.

Por ejemplo en la siguiente imagen vemos el menú de una web que a priori parece que no debería tener problemas.

Los enlaces se pueden pulsar pero en realidad los buscadores no pueden acceder a ellos. ¿Cómo podemos saberlo?

Una manera de ver si un enlace es accesible es comprobar cómo google tiene guardada tu página en su caché. Para ello pondremos en nuestro navegador, delante de la URL de tu sitio la palabra “cache:” de la siguiente forma.

Tienes que cambiar www.tudominio.com por la página que quieras ver.

A continuación pulsamos “enter” y luego pulsamos en el link que dice “versión de solo texto”:

Si usas Internet explorer, para ver la caché, busca la página en Google y luego pincha sobre la flecha que hay a la derecha de la url de la página. Luego pincha “En caché”.

Lo que veremos en este momento es cómo guarda Google nuestra página en su caché. Y es aquí donde podemos ver si los enlaces anteriores son o no son accesibles.

Siguiendo con el ejemplo nos encontramos que Google no ve como enlace los links “Furgoneta”, “Camión”, “Tractora” y “Semirremolque”, por lo tanto Google no podrá acceder a estas secciones y en consecuencia esas páginas no aparecerán en Google (a menos que estén enlazadas correctamente desde otro lugar).

Esto es muy común si se usa Javascript, Ajax o Flash en los elementos de navegación.

En ocasiones, aunque los enlaces sean accesibles, si tu web es muy grande y tiene una arquitectura de la información mal hecha, es muy probable que el buscador tenga problemas para acceder a ciertas páginas. Generalmente ocurre con páginas que se encuentran en los niveles más profundos de la arquitectura del sitio como fichas de producto de categorías poco populares.


Para solucionarlo lo mejor es tener una arquitectura muy bien trabajada donde las páginas que nos interese posicionar no se encuentren a un nivel muy interno (a muchos clics de distancia de la home). También ayuda el hacer acciones de link-building contra secciones internas, es decir, crear una red de enlaces internos hacia estas páginas que permita a los buscadores encontrarlas más fácilmente.

No es habitual, paro también podría ocurrir que nuestro sitio no sea rastreable por los buscadores por el despiste del programador al lanzar la web, por olvidarse deabrir el archivo robots.txt a los buscadores. Si entráis enwww.tudominio.com/robots.txt y tenéis las siguientes instrucciones entonces ningún buscador podrá acceder a vuestro sitio web:

User-agent: *
Disallow: /

2# Indexar

Cuando el crawler rastrea una web, el segundo paso es indexar, en inglés “indexing”.

Esta fase es necesaria porque una vez que Google tiene todas las páginas debe prepararlas para que puedan indexar. Lo que hacen los buscadores es clasificar las páginas en función de la relevancia de los contenidos que hay en ellas y esto permita que la entrega de los resultados de búsqueda sea mucho más rápida.

¿Cómo funciona el índice de Google?

Por ejemplo, imaginar en que en todo internet existen solamente 100 páginas web. De ellas que contengan la palabra “curso” solo hay 7 páginas (las páginas 10, 2, 23, 5, 56, 44 y 38) y que contengan la palabra “seo” existen 6 (las páginas 15, 2, 23, 90, 9 y 44).

Los buscadores guardan y clasifican en su índice toda esta información. De una forma muy simplificada el índice de Google sería así:

Donde cada fila se llama “posting list”.

Ahora imaginaros que alguien busca “curso seo”. Gracias al índice que se ha creado, Google sabrá cuales son los documentos que contienen ambas palabras:

En este caso la fila “curso seo” es la intersección de las dos “posting list” creadas. Gracias a esta intersección se sabe que las páginas 2, 23 y 44 son las candidatas a mostrarse en la fase de ranking.

Problemas en la indexación

Los problemas de indexación más comunes son producidos por problemas de accesibilidad (recordar lo que hemos comentado en el apartado de rastreo).

También es probable que una página no se indexe porque esté duplicada o sea de baja calidad. Porque cuando Google se encuentra una página duplicada se guarda el derecho a indexarla. En este post de mi blog tenéis más información sobre esto.

En esta página, Google nos explica cómo podemos solucionar los problemas de contenido duplicado.

¿Cómo ver rápidamente problemas de indexación?

Una manera de ver si tenemos problemas de indexación es la siguiente:
1. Pide que te pasen todas las urls de tu web (lo puedes sacar de BBDD o pasando un crawler).

2. Haz la siguiente búsqueda en google con tu nombre de dominio.

El comando site: te da un número aproximado de las páginas indexadas que tiene tu sitio.

Si por ejemplo tuviera 1000 artículos en mi blog, y veo que Google solo tiene 164 indexados, esto sería una señal de que tengo problemas con mi sitio. Es decir, que estoy perdiendo una oportunidad de aparecer en Google.

3# Rankear

Por último llegamos a la tercera y última fase, la más compleja para un buscador. Esta fase consiste en mostrar los resultados más relevantes para una búsqueda determinada.

Como vimos en la fase de indexación, las páginas 2, 23 y 44 eran las mejores para ser mostradas para la búsqueda “curso seo”. Es ahora, justo en el momento de la búsqueda, cuando Google determina cuál es la mejor y para ello comprueba más de 200 factores. Por ejemplo, se fija en:

– Si la página tiene esas palabras en lugares clave (title, url, alt, h1…)
– Si la página tiene esas palabras juntas. Es decir, para esa query es mucho más relevante que la página tenga escrito “curso seo” que “curso para aprender de una vez por todas seo”. Y otros muchos conceptos semánticos.
– La cantidad, fuerza y calidad de los enlaces que reciba esa página.
– Tu historial de búsqueda, localización, dispositivo usado… para entender la intención y el contexto de la búsqueda. Por eso los rankings fijos no existen.
– La confianza de esa página.

¡Y todo esto lo hace en menos de medio segundo!

Si queréis más información hay un vídeo donde Matt Cutts, ingeniero de calidad de Google, nos explica cómo funciona un buscador de forma más sencilla y visual.

Espero que esta introducción a los buscadores os haya sido útil para entenderlos y queráis seguir profundizando.

Natzir Turrado, Consultor Independiente de SEO, CRO y Analítica Web.
Cofundador de la consultora FunnelPunk. Es profesor de Marketing Online en escuelas de negocio y ponente en los principales congresos de España.

Puedes leerle en su blog (analistaseo.es) seguirle en twitter (natzir9). Si quieres también puedes suscribirte a su blog. Para ello pon tu correo en este link. Una vez hecho te llegará un correo para acabar de confirmar la suscripción a su blog.

Anuncios
Categorías:CurosDeSeo, Google Etiquetas:

Google

HISTORIA de Google



 

Creadores

ÒGoogle es una empresa cuyo principal producto es el motor de búsqueda del mismo nombre.
ÒGoogle fue fundado en septiembre de 1998 por Larry Page y Sergey Brin, dos estudiantes de doctorado de Stanford.
ÒSergey Brin (23 años entonces) y Larry Page (24), confundadores de Google y actualmente presidente y CEO, se conocen en un acto que la Universidad de Stanford organiza para los candidatos de su Doctorado en Informática. Ambos tenían un objetivo común, conseguir información relevante a partir de una importante cantidad de datos.
Ideas de busqueda
ÒEn 1995 Larry y Sergey comienzan a trabajar en el “Digital Library Project” de la Universidad de Stanford. Comenzando a crear un algoritmo para la búsqueda de datos. Esa tecnología que Larry le da nombre de “PageRank” se convertiría mas tarde en el “corazón” que hará funcionar a Google.
BackRub – google
ÒEn 1996 Comienzan a desarrollar un buscador llamado “BackRub”. Y tal como indican en su descripción, BackRub está escrito en Java y Python, y corre sobre varias máquinas. La base de datos está alojada en un ordenador Sun Ultra II con 28GB de disco duro.
ÒEn 1997 BackRub se convierte en “Google”, el nombre proviene de un juego de palabras con el término “googol”, acuñado por Milton Sirotta, sobrino del matemático norteamericano Edward Kasner, para referirse al número representado por un 1 seguido de 100 ceros. El uso refleja la misión de la compañía de la inmensa cantidad de información disponible en la web. Y ese mismo año Larry y Sergey registran el dominio “google.com”.
Ò
fondos
ÒEn 1998 Larry y Sergey continuarón trabajando para perfeccionar la tecnología de búsqueda. A pesar de la fiebre “puntocom”, no lograbán encontrar inversionistas que financiarán Google, teniendo que conseguir dinero de sus familiares y amigos. Hasta que en el verano de ese mismo año Andy Bechtolsheim (cofundador de Sun Microsystems y vicepresidente de Cisco Systems) les firma un cheque por 100,000 dólares a nombre de “Google Inc.. Sin embargo “Google Inc.” no existe, y para cobrar el cheque necesitarón buscar un local y fundar una compañía con ese nombre.
ÒEl 7 de diciembre de 1998, Google Inc., ya disponía de oficinas propias en Menlo Park, California.
progreso
ÒGoogle.com tenía visitas por día de 10,000. En 1999 consiguierón 25 millones de dólares de dos importantes inversionistas Sequoia Capital y Kleiner Perking Caufield & Buyers.
ÒMeses después las oficinas en Menlon Park, ya eran pequeñas para ellos, así que se transladaron a Googleplex, la actual sede central de Google en Mountain View, California, con más empleados y respondiendo a alrededor de 500,000 visitas al día. Google es hoy el mejor buscador de la red y el más utilizado.
ÒEl 10 de Octubre del 2006 Google adquiere el portal de descargas de vídeo “online” YouTube por 1,650 millones de dólares.
alianzas
ÒGoogle, se ha convertido en un emblemático caso de complicidad con la censura al haber pactado con el gobierno de China los contenidos de sus páginas. Actualmente y como parte de su estrategia comercial de búsqueda de nuevos mercados, los resultados del buscador orientados al usuario chino sufren un filtrado previo, que obvia, aunque informando de ello, los resultados que puedan ser contrarios a las políticas del gobierno.
premios
ÒGoogle gana el Premio Príncipe de Asturias de Comunicación y Humanidades 2008; Premio que le hizo entrega el Principe de Asturias Felipe de Borbón el 24 de Octubre del 2008, en el Teatro Campoamor de Oviedo, España, al cofundador Larry Page y vicepresidente Nikesh Arora.
VIDEOS
Categorías:Google

E-learning EXAMEN

diciembre 27, 2010 Deja un comentario

e-learning

Definicion

El e-learning es una herramienta que va más allá de que un estudiante curse una materia a través de Internet. El e-learning permite ofrecer información, capacitaciónentrenamiento a todas aquellas personas que lo necesiten, en línea, en el momento y lugar más conveniente.
El e-learning no es más que la utilización de Internet para revolucionar la manera en que la gente aprende.

watch?v=88tYmK6EhQc

watch?v=EUL8Iw6DWww

Usos

Tradicionalmente, la fuerza de ventas, los nuevos empleados y los proveedores de una compañía participaban de seminarios de tres o cuatro días, dos o tres veces al año donde eran educados y capacitados sobre las últimas tendencias en la industria.Sin embargo, últimamente, esto resulta cada vez más difícil y costoso.
Las compañías, cada vez más, aprovechando la ventaja competitiva que ofrece Internet, están centrando sus estrategiasde capacitación y entrenamiento en-línea generando ahorros importantes en costos y ofreciéndole grandes ventajas en comodidad a los usuarios finales.

Gracias a las nuevas tecnologías de la información y la comunicación (TIC), los estudiantes “en línea” pueden comunicarse con sus compañeros “de clase” y docentes (profesores, tutores, mentores, etc.), de forma síncrona o asíncrona, sin limitaciones espacio-temporales. Es decir, se puede entender como una modalidad de aprendizaje dentro de la educación a distancia en la que se utilizan las redes de datos como medios (Internetintranets, etc.), las herramientas o aplicaciones hipertextuales como soporte (por ejemplo, correo electrónico,webchat, etc. ) y los contenidos y/o unidades de aprendizaje en línea como materiales formativos (por ejemplo, desde simples imágenes, audio, video, documentos, etc., hasta complejas producciones multimedia, “píldoras formativas“, etc.; sin olvidarnos de los contenidos construidos de forma colaborativa, derivados del desarrollo de la conocida comoWeb 2.0 ), entre otros.

Dentro de la modalidad a distancia, es una de las opciones que actualmente se utiliza con mayor frecuencia para atender la necesidad de educación continua o permanente. La generación de programas de perfeccionamiento profesional no reglados está en crecimiento debido a que existe un reconocimiento de que los trabajadores se capaciten y se adapten a los nuevos requerimientos productivos. Dadas sus características y el soporte tecnológico que lo respalda, se constituye en una alternativa para aquellos que combinan trabajo y actualización, ya que no es necesario acudir a una aula permanentemente.

Si la educación a distancia es, desde sus orígenes, una opción para atender la formación de personas adultas, éste tiene la ventaja de que los usuarios eligen sus propios horarios, y puede entrar a la plataforma desde cualquier lugar donde puedan acceder a una computadora y tengan conexión a Internet. La educación virtual da la oportunidad de que el estudiante elija sus horarios de estudio convirtiéndose así en una muy buena opción para aquellas personas autónomas que trabajen y quieran estudiar en sus momentos libres; por otra parte es importante mencionar que el e-learning es una excelente herramienta que puede ayudar a los usuarios no solo a aprender conceptos nuevos sino también a afianzar conocimientos y habilidades, aumentado así la autonomía y la motivación de los estudiantes por diferentes temas.

Plataforma

Sistema de gestión de contenidos (CMS) es un programa que permite crear una estructura de soporte para la creación y administración de contenidos por parte de los participantes principalmente en páginas web. El entorno de hardware y software diseñado para automatizar y gestionar el desarrollo de actividades formativas se conoce como Plataforma de TeleformaciónLMS (Learning Management System).

Un LMS registra usuarios, organiza catálogos de cursos, almacena datos de los usuarios y provee informes para la gestión. Suelen incluir también herramientas de comunicación al servicio de los participantes en los cursos. Las mejoras en usabilidad (navegación fácil e intuitiva) y accesibilidad (posibilidad de acceso por personas con discapacidad) permiten salvar la brecha digital y extender las posibilidades de formación a mayor número de personas, superando una de las mayores barreras del e-learning: la barrera tecnológica.

Actualmente existen gran mayoría de plataformas, tanto de comerciales como de código abierto. En el ámbito universitario es la WebCT la plataforma más utilizada, seguida a bastante distancia de la plataforma Edustan ce. Se está empezando a implantar con fuerza la plataforma de licencia libre Moodle. También se utiliza en varias universidades la plataforma de código abierto .LRN (se lee en inglés: dot learn), BlackboardeCollege. A nivel europeo, cobra especial relevancia la plataforma de código abierto Ilias, ampliamente utilizada en Europa tanto en instituciones educativas como en entornos de formación empresarial y Fronter, especialmente en Reino Unido y los países del norte.

Bibliografía:

http://www.icdn.cisco.com/global/MX/ee/el/que_es.shtml

http://www.reforma.com/cultura/articulo/089390/

http://es.wikipedia.org/wiki/E-learning

Videos:

Introduccion

https://www.youtube.com/watch?v=0mqs8V2hEA0

https://www.youtube.com/watch?v=EUL8Iw6DWww

Tips  e-lerning

https://www.youtube.com/watch?v=akAfCrOVhrM&feature=related


Categorías:Google

METODOLOGIA PARA DESARROLLO DE SITIOS WEB

Las etapas son las siguientes:

1. Reunión y Análisis de Requisitos
A partir de la información reunimos y analizamos, determinamos procesos y usuarios del sitio.

2. Diseño del Proyecto
Realizamos un Mapa del Sitio (Con los procesos principales, esto nos servirá como un modelo previo de todo el site)
Diseño de los procesos en los cuales se ven involucrados los usuarios
Diseño de la Base de Datos
Diseño de las interfaces o formularios

3. Desarrollo del Proyecto
Codificación en algún lenguaje de programación (PHP, JSP, ASP, AJAX, etc.)
Validaciones, control de seguridad, etc.

4. Diseño Visual
Apariencia del sitio, colores, fuentes, imagenes, animaciones, (la parte bonita del sitio)

5. Prueba y Depuración
Pruebas Off line
Pruebas On line

6. Documentación
La documentación se llevará a cabo durante todas las fases

7. Entrega del Sitio al cliente
Cabe destacar que esto propiamente no es una etapa pero la inclui por cualquier caso que alguien considere que es importante.

 

Categorías:Google

CMSs, MySQL y PHP

PHP es lo que llamamos un lenguaje de programacion del lado del servidor, esto significa que el código se interpreta en el servidor y no en el ordenador del usuario.

El código php interpretado, produce un resultado que es enviado al navegador del visitante en forma de HTML, imagen, documento .doc… de ninguna manera el navegador del visitante accede al código fuente en php sino solo a su resultado en HTML.

 

mportación/Exportación de datos con PHP y/o MySQL
Pues para exportar los datos de una consulta se me ocurre crear un fichero y rellenarlo: 

$f = fopen(“datos.txt”,”w”);
$sep = “;”;

while($reg = mysql_fetch_array($datos) ) {
$linea = $reg[‘campo1’] . $sep . $reg[‘campo2’] . $sep . $reg[‘campo3’]; //pones cada campo separado con $sep.
fwrite($f,$linea);
}
fclose($f);

El fichero que crea podría ser csv o txt, en realidad los dos ficheros de texto normales donde los campos están separados con un separador. En el caso de csv el separador es “;”.

Para importar, a partir de un fichero csv es muy fácil. Creas un script que lea esos archivos y almacene los datos en la base de datos.

 

Uso del Rand en Php

Orden rand() – Números al azar

Sintaxis

rand( ) rand( desde , inicio )

rand( ) nos sirve para obtener un número aleatorio entero.

Ej:

$numero = rand( ) // ————– Genera un número aleatorio entero positivo desde 0 y 32768.

$numero = rand( 1 , 100 ) // ———- Genera un número entre 1 y 100.

$numero = rand( -20 , 50 ) // ———- Genera un número entre -20 y 50.

Si necesitamos considerar números más grandes que el considerado anteriormente, en vez de usar la función rand( ) usamos la función mt_rand( ), cuyo criterio de uso es el mismo.

 

Configuración e Instalación WAMP, LAMP y CMSs

Es el acrónimo usado para describir un sistema de infraestructura de internet que usa las siguientes herramientas:

* Windows, como sistema operativo;
* Apache, como servidor web;
* MySQL, como gestor de bases de datos;
* PHP (generalmente), Perl, o Python, como lenguajes de programación.

El uso de un WAMP permite servir páginas html a internet, además de poder gestionar datos en ellas, al mismo tiempo un WAMP, proporciona lenguajes de programación para desarrollar aplicaciones web.

 

 

Categorías:Google

CMSs y SBGDs

Que es un CMS?

Un sistema de gestión de contenidos (Content Management System, abreviado CMS) es un programa que permite crear una estructura de soporte para la creación y administración de contenidos, principalmente en páginas web.

Clasificación de CMS

En el mundo de los CMS hay cientos de posibilidades y de variantes, ya sea por sus funcionalidades, casos de uso o por las tecnologías que se utilizan para crear las infraestructuras para la publicación y visualización de contenidos.

Una primera clasificación de CMS se podría dar entre sistemas propietarios y no propietarios. Digamos que un sistema propietario es el primer ejemplo que podemos encontrar de CMS, puesto que son herramientas creadas a medida para actualizar una página web. Cualquier página que se haya creado e incluya un sistema para actualizarla a través de formularios, o cualquier interfaz que facilite la publicación, es un sistema CMS. En los inicios de la web no existían sistemas CMS, comerciales o gratuitos, para gestionar los contenidos de los sitios, por lo que se tenía que programar un sistema para poder actualizarla rápidamente, propio para esa web. Por ejemplo, DesarrolloWeb.com tiene un CMS propietario, desarrollado por los creadores del sitio. Por otra parte, tenemos los CMS no propietarios (he buscado alguna palabra para referirme a ellos, pero siento decir que no la encuentro. Por supuesto que se agradece un comentario si alguien sabe cómo decir “no propietario” en una sola palabra), son sistemas que se han desarrollado por empresas o instituciones y que se disponibilizan para que sean utilizados para la creación de cualquier tipo de página web. Estos CMS no propietarios son, en muchos de los casos, completamente configurables, es decir, que sirven para producir cualquier tipo de web con cualquier clasificación de secciones y contenidos.

Esta sería una Lista de CMS de interés distintos de WordPress:

  1. MovableType
  2. Drupal
  3. Joomla
  4. Serendipity
  5. MODx
  6. Typo3
  7. TYPOlight
  8. Sava CMS (ColdFusion)
  9. MiaCMS
  10. Jahia
  11. DotClear
  12. Umbraco (ASP.NET)
  13. BIGACE
  14. Nucleus CMS
  15. SilverStripe
  16. Radiant (Ruby on Rails)
  17. Frog
  18. Zikula
  19. Kentico (ASP.NET)
  20. XOOPS
  21. CMS Made Simple
  22. Instant Update
  23. Plone
  24. SPIP
  25. Xaraya
  26. phpwcms
  27. Zope

SGBD

Los sistemas de gestión de bases de datos (en inglés database management system, abreviado DBMS) son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan.

El propósito general de los sistemas de gestión de bases de datos es el de manejar de manera clara, sencilla y ordenada un conjunto de datos que posteriormente se convertirán en información relevante para una organización.

Categorías:Google