Google lär sig indexera Flash

Alltsedan Macromedia i december 1996 lanserade den teknologi som sedan kom att bli känd som Flash har formatet varit stängt, properitärt och förvarat i binära SWF-filer.

Följden av det binära formatet i kombination med den properitära implementeringen har varit att det varit omöjligt för sökmotorerna att indexera innehåll i Flash.

Mer än tre år efter det att Adobe köpt upp Macromedia och därmed teknologin för Flash, verkar företaget på allvar fått upp ögonen för problemet och meddelar i en artikel att sökbart SWF-innehåll är viktigt och man borde inte borde behöva offra sökbarhet bland sökmotorerna för att kunna använda Flash.

Improved search of SWF content will provide immediate benefits to companies leveraging Adobe Flash software. Without additional changes to content, developers can continue to provide experiences that are possible only with Adobe Flash technology without the trade-off of a loss in search indexing

Adobe’s Searchable SWF library

Resultatet blev att Adobe i samråd med två av de tyngsta aktörerna på marknaden, Google och Yahoo, tog fram vad som idag refereras till som Adobe’s Searchable SWF library. Biblioteket tillhandahåller funktioner som gör det möjligt för sökmotorer att indexera textinnehåll i Flash. De tre företagen har lagt stor vikt vid att det inte skall behövas några modifikationer av det befintligt innehållet i SWF-filen skall behövas. Istället har de arbetat under devisen – det dina besökare kan se kan också vi se, vilket de tycks ha lyckats med.

Hemligheten bakom tekniken är att Adobes bibliotek låter sökmotorerna navigera och visa sidan som en besökare skulle ha sett den. Det handlar alltså inte om någon dekompilering av SWF-filer och författare behöver således inte vara rädda att känslig ActionScript-kod skall läcka ut av misstag.

Fullständig indexering av text

Indexeringen av textinnehåll är fullständig. Texten extraheras och används för visning i sökresultat. Även länkar till både interna och externa filer följs upp. I det innehåll som kan indexeras inkluderas också s.k. “gadgets” såsom menyer, knappar och liknande. Viktigt är dock att komma ihåg att för att en text skall indexeras eller en länk skall följas upp måste det vara en just text. En bild eller bildlänk utan ankartext lämnas därhän.

Stöd för inbäddning av JavaScript

Google tolkar normalt inte JavaScript, men eftersom Flash ofta bäddas in med hjälp utav JavaScript meddelar google att de inkluderat stöd för ”de vanligast förkommande JavaScript-metoderna” för att bädda in Flash, den enda namngivna är dock populära SWFObject och SWFObject 2.

Begränsningar

I skrivandets stund är googles indexeringen av Flash fortfarande begränsad. Externt innehåll som laddas från t.ex XML-filer indexeras inte. Flashfiler innehållande språk som läses från höger till vänster indexeras inte heller. Google låter dock meddela att ovanstående är högprioritet just nu och förhoppningsvis lär vi få se detta och en hel del andra intressanta finesser kring Flash inom en snar framtid.

Läs mer

Författare: Daniel Örn