Tips til design

Brugervenlighed

Benyt Internettets konventioner. Det giver brugeren tryghed.

Brugervenligt webdesign

RSS feed med PHP - en tutorial

Denne tutorial beskriver et simpelt PHP script, der kan vise XML på din side. XML er det sprog, som f.eks. RSS feeds er skrevet i.

Sciptet benytter PHP udvidelsen SimpleXML, som kan importere en XML fil fra en fremmed server. SimpleXML er indbygget i PHP5 og opefter, og er også aktiveret pr default.

En simpel PHP opskrift på en RSS feed reader

Mit script er meget simpelt, men mere skal der ikke til.

1. Feedet loades med funktionen simplexml_load_file(). XML'en gemmes som et objekt i variablen $feed.
2. En tæller initieres for at kunne styre, hvor mange nyheder, der skal vises.
3. En løkke startes. Den løbes igennem for hvert item-element i channel-elementet i feeden.
4. Så længe antallet af gennemløb($taeller) er mindre end det ønskede antal nyheder ($antal), skrives følgende ud:
5. titel, skrives i a-tag og link sættes som href
6. dato, i kursiv
7. og description, som er et resume af nyheden.
8. Break sender os ud af while-løkken, og ned til tælleren, der tæller 1 op, før vi kører foreach løkken igennem igen.

<?php
		
  // RSS feeden hentes. Gemmes som obejct i $feed
  $feed = simplexml_load_file('http://ing.dk/rss/nyheder');
			
  //Taeller til at begrænse antallet af nyheder
  $taeller  = 0;
  $antal = 5;

  //alt køres igennem utf8_decode() Der returner  ISO-8859-1
  foreach($feed->channel->item as $item){
      while($taeller<$antal){
         print utf8_decode("<a href='{$item->link}'>{$item->title}</a><br/>");
         print utf8_decode("<i>{$item->pubDate} </i><br/>");
         print utf8_decode("{$item->description} <br/><br/>");
         break;
         }
      $taeller ++;
      }  
?>

OBS: Scriptet er skrevet til RSS 2.0, og skal justeres for at virke med RSS1.0 eller atom. Se nedenfor

Potentielle problemer med XML

Scriptet er meget simpelt, men der er 2 potentielle problemområder.

Det første er tegnsættet, der voldte mig problemer. Det løste jeg ved at køre XML gennem med utf8_decode(), som returner ISO-8859-1 fra en utf-8 streng.

Et andet potentielt problem er formatet på feeden. Det varierer mellem rss 1.0, rss2.0 og atom.

Hvert format har sine egne tags og formateringer. Forskellen er imiddlertidig små, og når man først har styr på begreberne, skulle det være forholdsvist simpelt at tilpasse scriptet til det ønskede format.

Du skal bare kigge på kildekoden og så finde den rigtige "vej" ned gennem XML'ens struktur til de ønskede data.

Go' fornøjelse.

Et RSS 1.0 problem

Fik denne mail fra Flemming:

Tak for en fin lille tutorial om din RSS feed reader. Meget klar og velskrevet. Jeg har brugt koden til at blive inspireret til en lidt større reader, der læser flere feeds, og kun tager de, der matcher specielle søgeord, osv.

Jeg kan uden problemer læse feeds fra alle de steder, jeg har forsøgt, undtagen Politiken (fx http://politiken.dk/rss/senestenyt.rss). Det undrer mig. Har forsøgt at udelade extension/ændre til xml/... Hvis jeg forsøger at dumpe strukturen med print_r ser det ud til at simplexml_loadfile slet ikke læser noget?

Har du erfaret noget tilsvarende, og har du en forklaring?


Politikkens feed er en RSS 1.0, derfor skal der laves en lille ændring i strukturen. I den første fremhævede linje har jeg fjernet "-> channel", da de "items" som vi skal bruge, ikke ligger inde i "channel-tagget" i RSS 1.0 XML'en.

I den anden fremhævede linie har jeg udkommenteret RSS 1.0's dato tag. PHP kan ikke "parse" kolonnet i "dc:date".

Har ikke fundet en løsning på det problem, så hvis du kender en, så gi' mig lige et hint.

<?php
		
  // RSS feeden hentes. Gemmes som object i $feed
  $feed = simplexml_load_file('http://politiken.dk/rss/senestenyt.rss');

  //Taeller til at begrænse antallet af nyheder
  $taeller  = 0;
  $antal = 5;

  //alt køres igennem utf8_decode() Der returner  ISO-8859-1 
  foreach($feed->item as $item){
      while($taeller<$antal){
         print utf8_decode("<a href='{$item->link}'>{$item->title}</a><br/>");
         //print utf8_decode("<i>{$item->dc:date} </i><br/>"); 
         print utf8_decode("{$item->description} <br/><br/>");
         break;
         }
      $taeller ++;
      }  
?>

OBS: RSS 1.0 feedreader. Dato-funktionen er udkommenteret

OpenSearch. Et alternativt eksempel

OpenSearch er en samling af teknologier, som giver søgemaskiner mulighed for at levere søgeresultater i et simpelt og lettilgængeligt XML format (RSS eller ATOM).

Søgemaskiner, der benytter open search teknologier, kan bruges af webudviklere til at vise resultaterne af en søgning i egne applikationer.

Statsbibliotekets suveræne søgemaskine Summa har en OpenSearch grænseflade, der kan benyttes på url'en:
http://statsbiblioteket.dk/search/opensearch.jsp?query=eksempel&start=1&number=10

Da resultatet fra Summa leveres som XML i RSS format, kan vi altså bruge vores hjemmebyggede feedreader til at vise søge resultatet med. De eneste forskel er, at der skal sendes en række parametrer med url'en. F.eks. en query-streng (en søgestreng), og et number, der angiver hvor mange poster, vi gerne vil se.

Dvs. at vi skal bruge brugerens søgeinput til at opbygge url'en med. Det er ganske simpelt. Du laver en formular ligesom den nedenstående, og tilføjer følgende kode for at opbygge url'en:

<?php
  //Brugerinput hentes, konverteres til utf-8, url'encodes, 
  //Derefter opbygges url og RSS feeden hentes
  if($_POST["soeg"] == "ok"){
	$query = urlencode(utf8_encode( $_POST["querystreng"]));
	$poster = $_POST["poster"];
	$url = "http://statsbiblioteket.dk/search/opensearch.jsp?query=";
	$url = $url . $query . "&start=1&number=" . $poster;
	$feed = simplexml_load_file($url);
	}			 
?>

Søgestrengen skal først konverteres fra ISO-8859-15 til utf-8, for at Summa Opensearch kan forstå de danske karakterer æ,ø og å.

Derefter bliver strengen url-encoded for at kunne sende de samme danske tegn og mellem rum i søgestrengen med i url'en.

OpenSearch i Summa

  Tast søgeordet ind:
  Antal poster du vil se:
 

RSS feed reader - et eksempel

Feed fra Ingeniøren

USA øger elproduktion på kul - men det er på lånt tid
Wed, 20 Oct 2021 12:34:07 +0000
PLUS. Høje gaspriser får amerikanske kulkraftværker til at øge produktionen i 2021. Men det vil ikke vare ved, da flere og flere kulkraftværker bliver taget ud af drift.

Firbenede robotter løser komplekse opgaver i fællesskab
Wed, 20 Oct 2021 11:18:00 +0000
Forskere fra University of Notre Dame i USA har konstrueret små, firbenede robotter, der automatisk kan kommunikere indbyrdes og løse opgaver i flok og håber på, de kan bidrage til alt fra miljøovervågning til udforskning af rummet

Her fjernes gammel PFOS-forurening med tre kæmpe kulfiltre
Wed, 20 Oct 2021 10:21:00 +0000
PLUS. I Københavns Lufthavn bliver der afværgepumpet for PFAS-stoffer, bl.a. under en brandøvelsesplads. Vandet bliver renset med aktivt kul, og sekundavandet bliver genbrugt eller ledes ud i Øresund.

Ny overraskende beregning af informationsmængden i Universet
Wed, 20 Oct 2021 09:10:00 +0000
Hver enkelt elementarpartikel indeholder halvanden bit information, og tilsammen indeholder de 6 x 10^80 bits, viser ny opgørelse baseret på klassisk informationsteori.

Politisk krav om digitalisering i fængsler: »Elektroniske journaler bør være en selvfølge«
Wed, 20 Oct 2021 08:43:00 +0000
Indførelsen af en elektronisk patientjournal i landets fængsler skal være en del af den kommende aftale på Kriminalforsorgens område. Sådan lyder den kontante besked fra regeringens støtteparti, SF, der får opbakning af både Det Konservative Folkeparti og Dansk Folkeparti.

RSS feed og ophavsretten

Du skal være opmærksom på ophavsretten til det feed du ønsker at hente, og få tjekket rettighederne inden du går igang.

Det er nemlig de færreste nyhedsformidlere, som tillader at man bruger deres feed. De fleste vil helst prakke os en færdig designet nyhedsbox på.

En af undtagelserne er Ingeniøren, der p.t. tillader, at man bruger deres RSS feed på egen hjemmeside, så længe der linkes tilbage de originale artikler.