Design tips

Brugervenlighed

Vis brugeren hvad der er det vigtigste på siden. Skab hierakier.

Brugervenligt webdesign

RSS feed med PHP - en tutorial

Denne tutorial beskriver et simpelt PHP script, der kan vise XML på din side. XML er det sprog, som f.eks. RSS feeds er skrevet i.

Sciptet benytter PHP udvidelsen SimpleXML, som kan importere en XML fil fra en fremmed server. SimpleXML er indbygget i PHP5 og opefter, og er også aktiveret pr default.

En simpel PHP opskrift på en RSS feed reader

Mit script er meget simpelt, men mere skal der ikke til.

1. Feedet loades med funktionen simplexml_load_file(). XML'en gemmes som et objekt i variablen $feed.
2. En tæller initieres for at kunne styre, hvor mange nyheder, der skal vises.
3. En løkke startes. Den løbes igennem for hvert item-element i channel-elementet i feeden.
4. Så længe antallet af gennemløb($taeller) er mindre end det ønskede antal nyheder ($antal), skrives følgende ud:
5. titel, skrives i a-tag og link sættes som href
6. dato, i kursiv
7. og description, som er et resume af nyheden.
8. Break sender os ud af while-løkken, og ned til tælleren, der tæller 1 op, før vi kører foreach løkken igennem igen.

<?php
		
  // RSS feeden hentes. Gemmes som obejct i $feed
  $feed = simplexml_load_file('http://ing.dk/rss/nyheder');
			
  //Taeller til at begrænse antallet af nyheder
  $taeller  = 0;
  $antal = 5;

  //alt køres igennem utf8_decode() Der returner  ISO-8859-1
  foreach($feed->channel->item as $item){
      while($taeller<$antal){
         print utf8_decode("<a href='{$item->link}'>{$item->title}</a><br/>");
         print utf8_decode("<i>{$item->pubDate} </i><br/>");
         print utf8_decode("{$item->description} <br/><br/>");
         break;
         }
      $taeller ++;
      }  
?>

OBS: Scriptet er skrevet til RSS 2.0, og skal justeres for at virke med RSS1.0 eller atom. Se nedenfor

Potentielle problemer med XML

Scriptet er meget simpelt, men der er 2 potentielle problemområder.

Det første er tegnsættet, der voldte mig problemer. Det løste jeg ved at køre XML gennem med utf8_decode(), som returner ISO-8859-1 fra en utf-8 streng.

Et andet potentielt problem er formatet på feeden. Det varierer mellem rss 1.0, rss2.0 og atom.

Hvert format har sine egne tags og formateringer. Forskellen er imiddlertidig små, og når man først har styr på begreberne, skulle det være forholdsvist simpelt at tilpasse scriptet til det ønskede format.

Du skal bare kigge på kildekoden og så finde den rigtige "vej" ned gennem XML'ens struktur til de ønskede data.

Go' fornøjelse.

Et RSS 1.0 problem

Fik denne mail fra Flemming:

Tak for en fin lille tutorial om din RSS feed reader. Meget klar og velskrevet. Jeg har brugt koden til at blive inspireret til en lidt større reader, der læser flere feeds, og kun tager de, der matcher specielle søgeord, osv.

Jeg kan uden problemer læse feeds fra alle de steder, jeg har forsøgt, undtagen Politiken (fx http://politiken.dk/rss/senestenyt.rss). Det undrer mig. Har forsøgt at udelade extension/ændre til xml/... Hvis jeg forsøger at dumpe strukturen med print_r ser det ud til at simplexml_loadfile slet ikke læser noget?

Har du erfaret noget tilsvarende, og har du en forklaring?


Politikkens feed er en RSS 1.0, derfor skal der laves en lille ændring i strukturen. I den første fremhævede linje har jeg fjernet "-> channel", da de "items" som vi skal bruge, ikke ligger inde i "channel-tagget" i RSS 1.0 XML'en.

I den anden fremhævede linie har jeg udkommenteret RSS 1.0's dato tag. PHP kan ikke "parse" kolonnet i "dc:date".

Har ikke fundet en løsning på det problem, så hvis du kender en, så gi' mig lige et hint.

<?php
		
  // RSS feeden hentes. Gemmes som object i $feed
  $feed = simplexml_load_file('http://politiken.dk/rss/senestenyt.rss');

  //Taeller til at begrænse antallet af nyheder
  $taeller  = 0;
  $antal = 5;

  //alt køres igennem utf8_decode() Der returner  ISO-8859-1 
  foreach($feed->item as $item){
      while($taeller<$antal){
         print utf8_decode("<a href='{$item->link}'>{$item->title}</a><br/>");
         //print utf8_decode("<i>{$item->dc:date} </i><br/>"); 
         print utf8_decode("{$item->description} <br/><br/>");
         break;
         }
      $taeller ++;
      }  
?>

OBS: RSS 1.0 feedreader. Dato-funktionen er udkommenteret

OpenSearch. Et alternativt eksempel

OpenSearch er en samling af teknologier, som giver søgemaskiner mulighed for at levere søgeresultater i et simpelt og lettilgængeligt XML format (RSS eller ATOM).

Søgemaskiner, der benytter open search teknologier, kan bruges af webudviklere til at vise resultaterne af en søgning i egne applikationer.

Statsbibliotekets suveræne søgemaskine Summa har en OpenSearch grænseflade, der kan benyttes på url'en:
http://statsbiblioteket.dk/search/opensearch.jsp?query=eksempel&start=1&number=10

Da resultatet fra Summa leveres som XML i RSS format, kan vi altså bruge vores hjemmebyggede feedreader til at vise søge resultatet med. De eneste forskel er, at der skal sendes en række parametrer med url'en. F.eks. en query-streng (en søgestreng), og et number, der angiver hvor mange poster, vi gerne vil se.

Dvs. at vi skal bruge brugerens søgeinput til at opbygge url'en med. Det er ganske simpelt. Du laver en formular ligesom den nedenstående, og tilføjer følgende kode for at opbygge url'en:

<?php
  //Brugerinput hentes, konverteres til utf-8, url'encodes, 
  //Derefter opbygges url og RSS feeden hentes
  if($_POST["soeg"] == "ok"){
	$query = urlencode(utf8_encode( $_POST["querystreng"]));
	$poster = $_POST["poster"];
	$url = "http://statsbiblioteket.dk/search/opensearch.jsp?query=";
	$url = $url . $query . "&start=1&number=" . $poster;
	$feed = simplexml_load_file($url);
	}			 
?>

Søgestrengen skal først konverteres fra ISO-8859-15 til utf-8, for at Summa Opensearch kan forstå de danske karakterer æ,ø og å.

Derefter bliver strengen url-encoded for at kunne sende de samme danske tegn og mellem rum i søgestrengen med i url'en.

OpenSearch i Summa

  Tast søgeordet ind:
  Antal poster du vil se:
 

RSS feed reader - et eksempel

Feed fra Ingeniøren

Energikommissionen: Vi kan snart ikke hælde mere vedvarende energi ind i systemet
Mon, 24 Apr 2017 14:52:25 +0000
Hvis det står til Energikommissionen skal politikerne nu ikke mere snakke MW sol og vind, men koncentrere sig om at skabe rammerne for et 100 pct. vedvarende energisystem i 2050. Men det bliver ikke gratis.

Når prisen ikke er afgørende: 3D-printede titanium-gearhjul til cyklen
Mon, 24 Apr 2017 14:25:03 +0000
Jysk specialist har i samarbejde med Teknologisk institut taget endnu et skridt i retning af ultralette gearhjul til den velbeslåede cykelentusiast.

VIDEO: Sådan får man 46.000 ton platform ombord på verdens største transportfartøj
Mon, 24 Apr 2017 14:11:00 +0000
Understellet til Aasta Hansteen-platformen er 200 meter høj. Den gigantiske konstruktion skal sejles fra Sydkorea til et dybhavsgasfelt i Norskehavet.

Rusland afviser hackerangreb mod dansk forsvar
Mon, 24 Apr 2017 13:38:45 +0000

En talsperson for den russiske regering afviser, at Rusland skulle stå bag hackerangreb mod danske militærfolks email-konti.

https://www.version2.dk/artikel/rusland-afviser-hackerangreb-mod-dansk-forsvar-1075859
Version2


Første storstilede eftersøgning efter ekstraterrestrisk liv blev en nitte
Mon, 24 Apr 2017 13:08:00 +0000
Gennemtrevling af adskillige petabyte af data fra radioteleskoper har endnu ikke bragt forskerne tæt på at finde intelligent liv uden for Jorden. Men jagten fortsætter.

RSS feed og ophavsretten

Du skal være opmærksom på ophavsretten til det feed du ønsker at hente, og få tjekket rettighederne inden du går igang.

Det er nemlig de færreste nyhedsformidlere, som tillader at man bruger deres feed. De fleste vil helst prakke os en færdig designet nyhedsbox på.

En af undtagelserne er Ingeniøren, der p.t. tillader, at man bruger deres RSS feed på egen hjemmeside, så længe der linkes tilbage de originale artikler.