
목차는 문서에서 필수요소
책 제목을 살폈으면, 이제 책의 목차를 확인하자. 어떤 내용으로 전개될지 이해할 수 있기도 하고, 상위-하위 개념을 빠르게 인지할 수 있다. 목차의 관련해서는 카카오엔터프라이즈에서 작성한 좋은 글이 있으니 참고하시길.
검색 로봇에게도 이런 목차를 알려주면 좀 더 빠르게 이해할 수 있는데, 웹페이지의 목차가 바로 사이트맵이다. 검색 로봇은 전세계 웹사이트를 돌아다니느라고 매우 바쁘다. 이 아이도 이 웹사이트가 어떻게 구성되어 있고, 중요도가 어떻게 되는지 알면 좀 더 효율적으로 일할 수 있기 때문에, 사이트맵이 있는 걸 선호한다.(엄밀히 말하면, 제출하는 것이 사이트에 유리하다고 표현했다)
그러면 반드시 모든 사이트에 사이트맵이 필요할까?
꼭 그렇진 않다. 구글 기준으로 사이트가 크지 않거나, 멀티미디어 자료가 많지 않거나, 내부적으로 긴밀히 연결된 사이트라면 사이트맵이 필요하지 않다고 한다. 하지만 각 검색엔진에서 제공하는 검색 관리 플랫폼(예: 구글 서치콘솔, 네이버 웹마스터 도구 등)에서 사이트맵 제출을 요청하기도 하니 작성하는 것도 좋을 것이다. 결국 작성하라는 말. 사실 형태만 다를 뿐 IA와 비슷해서 작성이 어렵지 않다. 로봇 검색이 제약없이 모든 웹사이트에서 가능하다면 사이트맵 만들어주는 프로그램은 구글링만 해도 나온다.
xml로 작성한 사이트맵이 있다면 사이트 도메인 하위에 sitemap.xml로 넣어주면 로봇이 알아서 가져가고, 그렇지 않거나 별도로 지정해줘야 한다면 robots.txt에 별도로 작성해줘야 로봇이 빠르게 찾을 수 있다.

대부분의 사이트의 루트 도메인에 sitemap.xml로 입력하면 볼 수 있다. 만약 없으면 루트 도메인에 robots.txt로 입력하면, robots.txt에 별도의 sitemap.xml 파일 경로를 지정한 sitemap을 찾을 수 있다.
Sitemap.xml 작성하기
사이트맵은 RSS(Rich Site Summary) 또는 sitemap.xml 두가지 방식으로 작성할 수 있는데, RSS는 해본 적이 없어서 링크로 대체하고, sitemap.xml만 작성했던 기억을 더듬어 본다.
요소 | 설명 | 필수 여부 | 비고 |
loc | 수집 대상 URL로 웹사이트가 포함하는 URL을 작성 | 필수 | |
lastmod | 해당 페이지(URL)가 수정된 날짜 날짜 표기방식은 yyyy-mm-dd |
선택 | 대부분의 검색엔진에서 무시 |
changefreq | 업데이트 빈도를 지정 (always / hourly / daily / weekly / monthly / yearly / never) |
선택 | |
priority | 웹사이트 내 페이지의 우선순위 (0.0 ~ 1.0) |
선택 |
아래는 sitemap.org/protocol.html에 있는 샘플 예제다.
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.example.com/</loc>
<lastmod>2005-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=12&desc=vacation_hawaii</loc>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=73&desc=vacation_new_zealand</loc>
<lastmod>2004-12-23</lastmod>
<changefreq>weekly</changefreq>
</url>
<url>
<loc>http://www.example.com/catalog?item=74&desc=vacation_newfoundland</loc>
<lastmod>2004-12-23T18:00:15+00:00</lastmod>
<priority>0.3</priority>
</url>
<url>
<loc>http://www.example.com/catalog?item=83&desc=vacation_usa</loc>
<lastmod>2004-11-23</lastmod>
</url>
</urlset>
개인적으로 참고하는 sitemap은 Google이다. Google은 워낙 관련 사이트도 많고, 언어도 다양해서 어지간한 문제를 다 대응하는데 참고가 된다. 다음에 설명할 사이트맵 인덱스도 구글을 예시로 볼 수 있다.
사이트에 페이지가 너무 많은 경우 사이트맵 인덱스 작성하기
인덱스는 한국말로 번역하면 색인. 대학교 교재 맨 뒤에 각종 용어들 나열하고 용어가 나온 페이지를 찍어주는 그 아이가 색인(찾아보기)이다. 쉽게 생각하면 사이트맵 내에 또 트리 구조를 만드는 거라고 생각하면 쉽다.

사이트맵 인덱스는 <loc></loc> 사이에 메인 도메인 하위의 사이트맵이 들어간다. 그리고 <loc>를 감싸는 태그도 <url> </url>이 아니라 <sitemap> </sitemap>이고, 최상위 태그도 <urlset> </urlset>이 아닌 <sitemapindex> </sitemap>임을 확인할 수 있다.
요소 | 설명 | 필수 여부 | 비고 |
loc | 수집 대상 URL로 웹사이트가 포함하는 URL을 작성 | 필수 | |
lastmod | 해당 페이지(URL)가 수정된 날짜 날짜 표기방식은 yyyy-mm-dd |
선택 | 대부분의 검색엔진에서 무시 |
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>http://www.example.com/sitemap1.xml.gz</loc>
<lastmod>2004-10-01T18:23:17+00:00</lastmod>
</sitemap>
<sitemap>
<loc>http://www.example.com/sitemap2.xml.gz</loc>
<lastmod>2005-01-01</lastmod>
</sitemap>
</sitemapindex>
구글의 사이트맵 인덱스를 확인하고 싶다면, 브라우저 주소창에 아래 내용을 모두 입력하면 된다.
view-source:https://www.google.com/drive/sitemap.xml
어느 때 사이트맵 인덱스를 사용해야 할까?
하나의 xml 파일에 URL이 50,000개가 넘어가거나 파일 크기가 10MB를 초과한다면 사이트맵 인덱스를 사용하는 것이 좋다. 구글의 예제처럼 https://www.google.com/sitemap.xml에는 카테고리별 별 사이트맵(사이트맵 인덱스)을 작성하고, https://www.google.com/카테고리/sitemap.xml을 작성한다.
좋은 목차는 글을 읽을 때나, 쓸 때나 중요하듯이 사이트맵도 잘 작성해보도록 하자.
참고 자료
- sitemap.org: https://www.sitemaps.org/protocol.html
- 구글 웹마스터 도구: https://developers.google.com/search/docs/advanced/sitemaps/overview?hl=ko
- 네이버 서치 어드바이저: https://searchadvisor.naver.com/guide/request-feed
'기획 N년차 > 검색엔진최적화 | SEO' 카테고리의 다른 글
기본만 해도 먹히는 SEO, 검색엔진최적화 이해하기: ① 제목 (0) | 2022.01.25 |
---|