Mapper og standard Index Filer


Strukturer din site
TIPS: Bruk undermapper på en smart måte for å strukturere din site logisk, gjør vedlikehold lettere, og gi deler av siten din lett gjenkjennige URLer.
En website trenger ikke å ha alt i en mappe. Man kan bruke undermapper (noe grafiske brukermiljøer nå til dags kaller "mapper", mens vi gammeldagse IT folk foretrekker den mer tekniske termen) på siten din. Det er en god måte å ordne innholdet ditt på en logisk, og vedlikeholdsbesparende måte. Hvis du bare hiver alt i en mappe vil det bli forvekslet veldig snart. Undermapper kan benyttes til de følgende formålene:
  1. For å oppdele innholdet på siten din i logiske under-mapper. Dersom siten din har klare skillepunkt så gi hver del en undermappe. For eksempel vil en forretnings site gjerne ha en mappe for markedsføringsinformasjon om sine produkter, en annen for info om teknisk support og en tredje for aksjerapporter. En undermappe kan videre inndeles i ytterligere undermapper på neste nivå: markedsføringsmappen har gjerne en tredje undermappe for hver enkelt produkt serie
  2. For å legge grafikk i en annen mappe enn HTML filene. Når du redigerer HTML filene og ønsker å opplaste dem samlet til serveren, ønsker man ikke å kaste bort tiden på å laste de samme grafiske elementene på nytt igjen, men man vil ha problemer med å adskille dem fra HTML filene når alle er rotet i sammen.
  3. På samme måte, har man lyd filer, Java appleter eller annet mulitimedia tillegg, bruk da adskilte mapper for hver type innhold for å holde ting i orden.
TIPS: Når du første har bestemt deg for mapper og fil navn så forandre ikke på dem med mindre du har en veldig god grunn !
Ta en avgjørelse på mappestrukturen på siten din på et tidlig tidspunkt, når du starter å jobbe på den: det er mye enklere å utvikle og vedlikeholde en site som fra starten av har en lettfattelig struktur enn å forandre på en site som allerede har utviklet seg tilfeldig. Og forandrer du fil- og mappenavn etter at siten har vært oppe en stund, vil du ødelegge alle bokmerker, hyperlinker og søkemotor tilganger som har blitt gjort på deler av siten utenom hovedsiden. Så finn på lett fattelige navn fra starten av, og forsøk å unngå å forandre dem i etterkant om det ikke er absolutt nødvendig. Selv en triviell forandring som det å forandre alle dine .html filer til .htm eller omvendt vil bryte hyperlenker, så unngå det !
MERK: Både .htmlog .htm er kjente filtyper for HTML dokumenter. .html er gjerne regnet som den mest "ekte" typen, da den er en forkortelse for det fulle dokument formatet "HyperText Markup Language", men .htm ble tatt i bruk tidlig i Web historien grunnet utviklere som benyttet operativ system som MS-DOS eller Windows 3.1 som var begrenset til 3 tegns filending. Nå til dags, da det er få folk som benytter slike operativsystem på nettet, og med moderne FTP programmer som har støtte for mulighet til å tilføye tillegstegnet i enden av filnavnet ved opplasting, er det få grunner til å benytte den korte utgaven, og noen synes URLer ser klomsete ut med den korte filendingen. Noen redaktør verktøy, særlig de som er laget av Microsoft, har fremdeles denne som standard, så mange siter bruker det selv om utviklerens system mangler begrensninger som ledet til det. Faktisk er en av de vanlig misforståelsene i filnavn giving at det må begrenses til 8 tegn og en 3 tegns filending: for de fleste systemer i bruk stemmer dette ikke lenger, og selv selv systemer som er begrenset på denne måten har ingen problem med å gå gjennom web sites med URL navn som ikke holder seg til denne begrensningen.
Her er det mer enn noe annet sted en god anledning til å påminne deg på, at på UNIX servere (som er det som benyttes på flesteparten av Web site bruk), skiller filnavn mellom stor og liten bokstav. Et navn med stor bokstaver som INDEX.HTML er noe annet fra et med små bokstaver som index.html, og begge er forskjellige fra hver av de ulike variantene som Index.Html og index.HTML. Så når du lager nye filer og mapper på en web site, vær oppmerksom på om du navngir dem med store eller små bokstaver, og vær konsistent. All lenker til en angitt fil vil måtte være samstemmig når det gjelder måten filen er på serveren. Med mindre det er en god grunn for noe annet skal du benytte små bokstaver i navnene dine overalt; det er normalt denne måten brukere er vant med å skrive inn URLer. (Selv som serveren din er en slik, som Windows, som ikke skiller mellom store og små bokstaver i filnavn, bør du likevel være konsistent på varianten i lenkene dine, siden de som har hver sin utgave enten små eller store bokstaver er ulike URLer selv om de henter den samme filen, og vil hver for seg bli lagret i hurigminnet til nettleseren og kaste bort minne og nedlastnings tid.)


Standard index filer
TIPS: Benytt standard index fil for å forenkle URL på siten din. Gjør det samme for undermapper, for å forenkle URLene til dine under-siter.
Nærmest alle websiter har en standard fil, vanligvis index.html, men noen ganger default.html,welcome.html, eller default.htm, den vil bil lastet inn automatisk når et mappe navn er brukt som URL. Du kan utnytte dette for å lage URLen din kortere og mer elegant. Mange brukere er ikke klar over dette og bruker URLer som dette:
Om Mary navnga hoved siden sin til index.html, kunne hun oppgi URLen sin som:
Noen folk får bare dette til delvis, og oppgir URLen sin som:
De benyttet det riktige filnavnet, men skjønte ikke at de faktisk ikke trengte å skrive det navnet. Filnavnet uten filendingen, er enklere å skrive, og ser penere ut (se merknadene i linken under angående å linke tilbake til din hjemmeside)
Sett en standard index fil i hver mappe, også mapper som egentlig ikke trenger en (for eksempel din grafikk mappe). Om du ikke gjør det, så vil en bruker som skriver inn mappe navnet som en URL få opp en uredigert mappe listing, og du har gjerne filer som du helst ikke vil at vanlig brukere skal se (som sider som ennå er under utvikling). En "simpel" index fil forhindrer slik snoking.
Skråstrek på slutten av filbanenavn
TIPS: Ikke utelat den siste skråstreken i mappe navn URLer !
Ta alltid med den siste skråstreken (/) på slutten av en URL som slutter med et mappenavn. Om du benytter:
(uten skråstreken), vil nettleseren først prøve å hente en fil istedet for en mappe, og ikke før serveren blir klar over at ~msmith er et mappe navn vil den be nettleseren om å tilføye skråstreken og prøve på nytt. Dette krever en ekstre runde med kommunikasjon mellom nettleseren og serveren, og senker farten på innhentingen. Nettleseren vet heller ikke på forhånd at adressen uten går til samme siden som den som har skråstrek, så den vil ikke vise lenken som "besøkt" dersom brukeren har vært der før, og vil ikke kunne benytte seg av en tidligere hurtiglagret utgave av siden dersom dette eksisterer.
Og enda verre, noen eldre nettlesere (noen utgaver av Mosaic, for eksempel) som ikke håndterer denne typen videresendinger på en riktig måte. De drar gjerne opp den riktige web siden uten skråstrek, men de mislykkes så å håndtere relative linker fra siden på en korrekt måte. En lenke til stuff.html fra URLen http://www.someplace.net/~msmith/ bør til slutt føre til http://www.someplace.net/~msmith/stuff.html , men dersom skråstreken er utelatt og nettleserens programvare ikke er smart nok til å tilføye den når det er videresendt fra serveren, vil det bli tolket som det er et mappenivå høyere opp i treet, og analysere den relative URLen som http://www.someplace.net/stuff.html. Dette vil så forårsake en 404 Ikke funnet feil, og brukeren vil ikke skjønne hvorfor.
Om du bruker elemntet for å spesifisere en grunnleggende URL for siten din, er det enda mer viktig å ta med skråstreken bak; det vil ikke fungere uten den, da nettleseren vil analysere relative referanser i det den bruker mappen som er på et høyere nivå enn intensjonen din.
En veldig fremstående site hvor de som laget den ikke lykkes i å iakta mitt råd om skråstreker bak er den offisielle regjeringens utgivelse av Ken Starr rapporten
angående predisent Bill Clintons' interne med Monica Lewinsky. Grunnet media blest, fikk denne rapporten (utgitt på mange offisielle regjerning siter 11. september 1998 og kort tid etter på mange siter i privat sektor) noe av den mest heftige internett trafikken noen gang, som forårsaket at serveren ble overbelastet i de første timene rapporten var ute at folk fleste kunne ikke koble seg opp. Uheldigvis, regjeringen gjorde problemet verre ved å benytte utgaver av URLer for disse sitene som manglet skråstrek overalt hvor de publiserte eller linket til disse sitene, og dermed forårsaket at hver tilgang til siten fikk en mer server behandling enn det hadde trengs dersom skåstreken hadde blitt benyttet. Men den høye trafikken siten hadde på denne tiden, forårsaket dette sannsynligvis lange forsinkelser for mange menneskers tilganger.
Enda en grunn for å bruke skråstreker...
Når URLer blir publisert i trykte medier som aviser, blader og nyhetsbrev, får de ofte innsatte setninger med punktum i slutten. Noen lesere (særlig de som er nybegynnere på nettet og uvitende om hvilke tegn som normalt er i en URL og rekkefølgen) vil tenke at punktumet er en del av URLen og skrive dette inn i nettleseren. Om URLen ender med skåstrek, vil det å føye til et punktum bli behandlet av de fleste servere som en referanse til den "punktum" lenke-sybolske mappen, som peker til den nåværende mappen. Dette vil hente fram den samme siden som brukeren ville fått uten det ekstra punktumet (riktignok med en litt lite elegant URL) Uten den avsluttende skåstreken ville det å tilføye et punktum forårsaket at det ville blitt lagt ved det forespurte filnavnet, som vanligvis ville forårsaket en 404 Ikke funnet feil.
En avsluttende bemerkning om skråstreker
Når alt dette er sagt, burde jeg påminne deg om å ikke "overkorrigere" ved å tilføye skråstreker til URLer som ikke er ment å ha dem. Dersom URL snarere refererer til en fil en til en mappe, burde det ikke være en skåstrek på enden. Så ikke skriv "http://www.someplace.net/~msmith/stuff.html/"!
Å linke tilbake til hjemmesiden


TIPS: Hjemmesiden er (vanligvis) kalt index.html, men ikke link til det filnavnet !
Når du linker tilbake til hjemmesiden din fra andre sider på siten din, bruk <A HREF="./"> istedet for <A HREF="index.html">. Denne "punktum-skråstrek" syntaksen gjør at indeksen til den nåværende mappen blir lastet inn under den samme URL syntaksen som brukeren brukte å aksessere siten med første gangen (kun mappenavn), mens den siste syntaksen sender brukeren til en URLen med en overflødig "index.html" knyttet til seg, som nettleseren ikke vil oppfatte at er den samme siden og vil dermed ikke vise lenken som "besøkt" eller benytte hurtiglagrede utgaver. Dersom brukeren lenker til eller bokmerker siden vil de ende opp med å spre din mindre elegante "index.html" URLen istedet for det mer rene mappe navnet. (Noen WYSIWYG editor program som Microsoft Front Page avslår å la deg bruke lenker på deg måten jeg anbefaler, selv det å forandre manuelt innskrevne "./" lenker til "index.html" for deg. Det er en av grunnene til at jeg ikke kan fordra slike editor program, og at jeg kun benytter vanlig tekst editor program for å gjøre min egen editering.)
MERK: Som en generell regel, burde du være konsistent og linke til hver av dine sider med en enkelt "kanonisk" URL per side, slik at fargen som markerer "besøkt" og nettleserens hurtigminne fungerer skikkelig. Mine merknader om linking til standard index og alltid benytte avsluttende skråstreker i mappe lenker er to instanser av dette; andre tilfeller omfatter siter som er aksessible via mange domener eller verts navn: http://www.yoursite.com/ og http://yoursite.com/ vil kanskje begge fungere, men du burde velge en av dem som standard måte å linke til din site istedet for å blande dem sammen. Noen lenker med hensikt til mange varianter av adressen sin som en måte å få søkemotorer til å indeksere dem flere ganger, men dette minner meg om "spamdexing", og det er irriterende for brukeren å bukte seg med mange utgaver av den samme siden når dette vises i søkeresultatene.

Også, om du benytter de samme grafiske elementene på mange steder, forsikre deg da om at du bruker den samme utgaven av den, med den samme URLen, slik at nettlesere kan benytte den tidligere hurtiglagrede utgaven istedet for å stadig laste det inn på nytt.
Du kan benytte index filer i hver undermappe hvis du har flere mapper, så Mary kan lage under-mapper for hennes hobbier som frimerkesamling og katter som
I en slik struktur, vil hovedmenyene av undermappene til "frimerker" og "katter" være i index.html filene til de respektive mappene, og det kan være et ubegrenset antall av andre filer i hver av mappene. Men ikke rot til strukturen med å legge hovedmenyen andre steder; jeg har sett sites som benytter "stamps.html" i over mappen som hovedmenyen til undersiten "frimerker", med resten av filene i undermappen "frimerker/". Denne ulogiske plasseringen skiller undermappe menyen fra deres relaterte filer, så jeg vet ikke hva utvikleren tenkte når han eller hun gjorde det.

Om du legger hoved index filen til undermappen i den passende mappen, men ikke navngir som standard index, vil du ende opp med "overflødige" URLer som:
Jeg liker å kalle slike URLer "Foo-slash-foo" URLer, siden de er av typen foo/foo.html (where "foo" er en "data nerd" gruppens favoritt betegnelse på et "vilkårlig variabel" navn, som representerer enhver tegn streng). Overflødige URLer ser litt dumme ut, og er lenger enn URLene du kunne ha hatt ved å benytte standard filer og sitere URLen kun ved mappenavnet. Jeg har til og med sett 3 og 4 ganger overflødige URLer på siter som virket til å gjøre alt for å benytte svært dype mappe hierarkier og unngå å benytte standard indeksering noe som medfører voldsomme siteringer som:
Sannsynligvis, tenkte utvikleren enkelt og greit ikke klart nok når han planla fil- og mappenavn på en slik site. Du kan klare bedre !

MERK:  Jeg tenkte at da jeg dro fram "foocorp" eksempelet over at dette var en utpønsket, overdreven URL brukt for effektens skyld, og at det var usannsynlig å møte på noe så ille i den virkelige verden... men jeg fant ut at adressen til Major League Baseball's site mlb.com videresender til denne grusomheten:
Når du linker til over mappen bruk HREF="../" (to punktum og en skråstrek); når du linker til søsken mappe benytt HREF="../cats/"; for å linke til index av en undermappe under den nåværende, benytt navnet uten noen punktum eller skråstreker foran som HREF="stamps/". For å gå opp to nivåer til "besteforelder" mappen benytt HREF="../../"
En ting å bemerke: Dersom du ordner linkene slik jeg anbefaler her, vil de ikke fungere når du går gjennom dine web sider på hard disken din, da hard disken din ikke har noen "standard" filnavn som en mappe index. Du vil se den ubehandlede mappen når du følger en slik link. Men utvikler du siten din for å se bra ut på hard disken eller den destinerte web serveren ? Med mindre du utvikler en site for å ha på diskett eller CD-Rom for å bli kjørt på et nettverkløst system, så er målet med utviklingen din å få siten til å fungere bra på serveren, så du burde holde ut med litt ubehagelighet når du tester den på din egen maskin før du opplaster den. Når du følger en lenke og en ubehandlet mappe dukker opp, er dette ikke en feil; bare trykk på "index.html" og fortsett, med bevisstheten om at dette "problemet" vil forsvinne med det samme du laster den opp på serveren hvor den hører hjemme. Om du trenger en utgave av siten som kjører korrekt på en hard disk eller diskett, så er det noen program tilgjengelige for å eksportere en web site til en disk på en kjørbar måte, noe som automatisk forandrer alle lenkene til gyldige filnavn istedet for mappe navn. Teleport Pro og WebSnake er 2 slike programmer, tilgjengelige på TUCOWS


Lenker