6. Scheme(protocol)
• Scheme는 주어진 리소스에 어떻게 접근하는 알려주는 정보.
• 알파벳으로 시작
• URL의 나머지 부분들과 ‘:’ 문자로 구분한다.
• 대소문자 구분하지 않는다.
• http, mailto, ftp, rtsp 등..
7. Host, port
• Host는 접근 하려고 하는 리소스를 가지고 있는 인터넷상의 호스트 장비
• Host는 host명(www.example.com)이나 ip 주소로 제공한다.
• Port는 서버가 열어 놓은 network port
• http default port: 80
14. 상대URL이 절대 URL 만들기
<html>
<body>
<a href=‘/hammer.html’>hammers</a>
중략..
기저URL : scheme(http), host(www.joes-hardware.com) 추측가능.
http://www.joes-hardware.com/tool.html
상대 URL :
/hammers.html
http://www.joes-hardware.com/hammers.html
새로운 절대URL
15. 기저(base) URL
• 리소스에서 명시적으로 제공
– Html에서는 <base>라는 태그로 기술 가능.
<base href="http://www.w3schools.com/images/" target="_blank">
• 리소스를 포함하고 있는 기저 URL
– 리소스의 URL을 기저 URL로 사용가능.(이전 예제)
• 기저 URL이 없는 경우
– 불완전 하거나 깨진 URL일 수 도 있다.
• 상대 참조 해석하기
– rfc1808 , rfc 2396 참조... (잘 이해가 안되는 부분..)
16. URL 문자 집합
• 컴퓨터 시스템의 기본 문자 집합은 영어중심.
• US-ASCII 문자 집합을 사용.
• 유럽언어나 기타 다른 언어들은 US-ASCII는 지원하지 않는다.
• URL은 특정 이진 데이터를 포함 해야 하기 때문에 이스케이프 문자열
을 쓸 수 있게 설계.
• 이스케이프 문자열은 US-ASCII에서 금지된 문자들로 , 특정 문자나 데이
터를 인코딩 할 수 있게 함으로 써 이동성과 완성도를 높였다.
17. 인코딩 체계
• 안전한 문자 집합의 한계를 넘어서기 위해서 인코딩 방식을 고안.
• 안전하지 않은 문자를 %로 시작해 ASCII 코드로 표현 되는 2개의 16진
수로 이루어진 이스케이프 문자로 바꾼다.
문자 AsCII 코드 URL의 예
~ 126(ox7E) http://www.exam.com/%7Ejoe
빈 문자 32(0x20) http://www.exam.com/m%20g
% 37(0x25) http://www.exam.com/100%25d
18. 문자제한
• 몇몇 문자는 특별한 의미로 예약
• US_ASCII 출력 가능한 문자 집합에 포함되지 않은 문자.
• 인터넷 게이트와 프로토콜에서 혼동되는 문자.
• 예약된 문자를 사용 할려면 인코딩 하여 사용.
• %, /, ., .., #, ?, ; , : $,+ 등..
19. 미래
• URL은 주소 이지 실제 이름이 아니다.
– URL이 특정 시점에 어떤 것이 위치한 곳을 알려준다.
• 리소스가 옮겨지면 URL은 더는 사용할 수 없다는 단점이 있다.
• 이러한 단점을 해결 하기 위해서는 객체의 위치와 상관없이 실제 객
체이름만으로 리소스를 찾는 것.
• IEFT는 URN(Uniform Resource Names)이라는 새로운 표준작업
에 착수.
– URN은 객체가 옮겨지더라도 항상 객체를 가리킬 수 있는 이름을 제공.
• 지속통합 자원 지시자로(PURL)을 사용하면 URL로 URN 기능을 제공.
20. PURL(Persistent uniform resource locators)
purl.oclc.org
www.joes-hardware.com
1. http://purl.olcl.org/ihardware
2. http://www.joes-hardware.com
1. 죠의 컴퓨터 가게 URL이 무엇인 리소스 리졸버에게 묻는다, 리졸버로부터 리소스의 현재
위치를 받는다.
2. 실제 URL로 리소스를 가젼온다