Annonse


Den usynlige Weben

For halvannet år siden hevdet amerikaneren Mark Skapinger at World Wide Web inneholdt 35 gigabytes tekst og 6 milliarder ord. I desember 1996, anslo det engelske tidsskriftet Information World Review størrelsen til 200 gigabytes.

Netcraft (http://www.netcraft.com/Survey/) teller hver måned antall tjenere på Weben. I begynnelsen av februar fant de 739.706.

250 gigabytes
Basert på disse to kildene kan gjennomsnittlig størrelse pr. Web-tjener konservativt anslås til 340.000 kilobytes. Dermed var Webens størrelse på rundt 250 gigabytes i begynnelsen av februar.

Heftig, tenker du kanskje. Det er imidlertid småtteri sammenlignet med den «usynlige Weben». Den telles i terabytes.

Annonse


Utenfor rekkevidde
Betegnelsen «den usynlige Weben» referer til data som ligger i de kommersielle online-tjenestenes beskyttede områder. Det dreier seg om mengder av dokumenter og databaser som kun er tilgjengelig for dem som betaler.

Dataene samles inn og vedlikeholdes av publiseringsselskaper som Knight-Ridders DIALOG, Questel-Orbit, NewsNet og de store nyhetsbyråene. Abonnenter får adgang med Netscape og Microsoft Explorer via Internett, men uten gyldig passord blir det bråstopp ved døra.

Søkemotorer ingen hjelp
Alta Vista, Lycos og de andre søke- og klippetjenestene får heller ikke adgang til det «usynlige». Et søk der forteller intet om hva som ligger gjemt og som vi følgelig «går glipp av».

Hittil har trengende derfor måttet abonnere på en lang rekke kommersielle tjenester og foreta mange søk for å finne data som passer med behovet.

At One
Personal Library Software Inc. (USA), produsent av tekstsøkeprogrammet CPL, vil endre dette. Ved årsskiftet åpnet de At One (http://www.at1.com). Her gis gratis adgang til en søkbar indeks over informasjon lagret i mer enn 1.000 av Webens private databaser. PLS hevder å ha indeksert over 5,7 terabytes med kommersiell informasjon så langt!

Angir kilden
Ett søk etter «Telenor» ga funn i 13 databaser: Paul Kagan Associates, Inc.s nyhetsbrev (via Baseline), NewsNet, Financial Times McCarthy, America Online og Communications Today. «Statoil» ble funnet i 18 databaser. Det eneste du får er imidlertid kildenes navn.

Klikk på lenkene i funnlistene bringer deg til de Web-tjenerne som oppbevarer dataene. Du må foreløpig være abonnent og betale standard bruksavgifter for å kunne lese.

Vil gi direkte tilgang
Om et halvt års tid håper At One å kunne tilby tekstene direkte til din skjerm mot betaling på vegne av eieren. Søk i indeksen skal fremdeles være gratis.

Her er noen av de informasjonsleverandører som foreløpig er med i programmet:

America Online (600+ databaser), NewsNet (1.000+ nyhetsbrev), Questel-Orbit (internasjonale databaser om patenter, varemerker, vitenskap, næringsliv, kjemi), Mecklermedia/iWorld (Internett-nyheter), EyeQ fra DataTimes (5.000+ kilder), Knight Ridders Dialog service (500+ dokumentdatabaser), United Nations, Baseline (40+ publikasjoner om USAs underholdnings- og TV-industri), Digital Ink (Washington Post nyheter), Phillips Publishing (100+ kilder om næringsliv og konsumentmarked), Grolier, Public Broadcasting System (345 TV-stasjoner i USA), The U.S. Department of Energy database, ZDNet (Ziff-Davis publikasjonene), House of Representatives Internet Law Library, Associated Press, DiscSense/DiscLaw CD-ROM (juridisk), Freedom Forum (journalistikk), Congressional Quarterly, m.fl.

Agenter og overvåking
At One tilbyr også «newsgroup mail agents». Dette har vi imidlertid hatt lenge fra andre (se http://www.reference.com). Det samme gjelder tilbudet om daglig overvåking av endringer i Web-sider med beskjed pr. epost. Det tilbys for eksempel fra tilbydere som http://informant.dartmouth.edu/.

Annonse