Flette inn PDF-innhold på nettsiden

Vi har tidligere blogget om hvorfor Office-filformater egner seg dårlig for publisering på nett, og hvordan man kan konvertere Office-innhold til HTML. Dersom man likevel må publisere Office-innhold, og omskriving til HTML-format ikke er aktuelt, kan konvertering til PDF være det beste alternativet.

PDF som alternativ til HTML

Formater som Word og Powerpoint egner seg godt for konvertering til PDF - og som regel kan du eksportere til PDF direkte fra Office.

PDF må regnes som andrevalget etter omskriving til HTML, men har mange fordeler fremfor å publisere det originale Office-formatet:

  • PDF-konvertering produserer en fil som brukere må åpne, men de fleste nettlesere kan åpne PDF-filer direkte uten noe tilleggsprogram installert hos brukeren.
  • Tekst og tabelldata i en PDF kan fremdeles markeres og kopieres av brukeren. 
  • Endringssporing, notater, kommentarer og liknende strippes bort fra PDF'en.
  • Utseendet på dokumentet vil være likt i alle nettlesere, i alle operativsystemer, i alle PDF-lesere.
  • Søkemotorer klarer fint å indeksere teksten i en PDF som er publisert.

Embedding (fletting) av PDF-innhold på nettstedet

En PDF kan du også flette inn (embedde) på nettsiden på en mer visuell måte - det finnes flere verktøy som f.eks Issuu og Yumpu, som lager en interaktiv visning av PDF-dokumentet. Disse spytter som regel ut en såkalt embed-kode, altså en liten HTML-snutt (som regel <iframe>) som legges inn i CMS'ets teksteditor. I Episerver bruker du multimedia-knappen i teksteditoren, der finnes det en "Inkluder" (Embed)-fane hvor du limer inn embed-koden:

tinymce_episerver_embed_media_norsk.jpg


Og slik ser det ut når du embedder en PDF på en side (eksemplet er fra Yumpu):

Embedding interactive PDFs in CMS.gif


Søkemotorer og PDF-innhold

Siden PDF-innhold er tekst, klarer søkemotorer å indeksere teksten inne i dokumentet. Dette er nyttig både for eksterne søkemotorer (f.eks Google, Bing) og interne søkemotorer (f.eks Episerver Find / Search & Navigation), siden søkemotorene da kan vise et tekstutdrag fra dokumentet i søkeresultatet.

Merk at dersom du embedder en PDF (f.eks med Issuu eller Yumpu), klarer ikke søkemotorene å indeksere innholdet i denne embeddingen, siden dette per definisjon er eksternt innhold som hentes via iframe. Ønsker du full indeksering, bør du i tillegg til å embedde, også ha PDF'en i ditt eget filarkiv og lenke til den i samme artikkel som du embedder PDF'en på.

Søkemotorer er såpass smarte at de klarer å finne PDF'ene på nettstedet ditt - så lenge du har lenket til dem på en eller annen publisert side på nettstedet. Søkemotoren pløyer altså ikke gjennom hele filarkivet ditt "uten invitasjon".

Derimot, dersom søkemotorer først har indeksert en fil i filarkivet i CMS'et ditt, vil søkemotoren kunne vise direktelenken til filen rett i søkeresultatet. Det betyr at selv om du ikke lenger lenker til filen på en publisert side, men du ikke har slettet filen fra CMS'et, vil søkemotorer fremdeles kunne vise treff for filen. Altså: Dersom du ønsker en fil bort fra søkemotorer, må du slette filen fra filarkivet i CMS'et. 

Under: Et eksempel på at det er lett å søke frem filer på et nettsted, uavhengig om det fortsatt finnes sider som lenker til filen:

google_result_pdf.jpg

 

Les mer om