네이버 검색창은 몇글자까지 검색될까?

Posted 2011/02/15 12:54, Filed under : 약간은 짧은 글, Posted by everyfishing
네이버에서 검색을 해보다가 갑자기 몇글자까지 넣을 수 있을까 하는 의문이 생겨서 테스트를 해봤습니다.

글자수를 세는 게 불편해서 그냥 1부터 0까지 10개의 숫자를 반복해서 넣어보니 총 100자까지 검색을 해주더군요.

12345678901234567890123456789012345678901234567890123456789012345678901234567890
12345678901234567890

위의 무식한 검색어 다음부터는 추가로 더 붙여서 검색을 해도 검색결과가 동일하네요.

12345678901234567890123456789012345678901234567890123456789012345678901234567890
12345678901234567890abc

따라서 100자를 넘어가는 검색어에 대해서는 무시하고 검색을 해준다고 보면 되겠습니다. 엄밀히 따지면 100바이트라고 표현해야 하겠지요. 그리고 한글은 1자가 2바이트를 차지하므로 한글로 생각하면 50자까지 수용합니다.

그래서 숫자는 90자까지만 넣고 뒤에 다른 한글 검색어를 함께 넣어보았습니다.

12345678901234567890123456789012345678901234567890123456789012345678901234567890
1234567890 그냥
※ 90자 + 공백 + 한글 2자 = 95바이트

100바이트를 넘지 않는 경우는 별 문제가 없습니다. 그래서 100바이트를 넘는 검색어를 입력해 하나의 단어 중간에서 100바이트를 넘게 입력해 보았습니다.

12345678901234567890123456789012345678901234567890123456789012345678901234567890
1234567890 그냥 없네요
※ 90자 + 공백 + 한글 2자 + 공백 + 한글 3자 = 102바이트
이 경우는 '없네요'에서 100바이트를 넘어가는 '요'가 무시됩니다.

위의 경우는 2바이트를 차지하는 한글이 100바이트에 딱 떨어지는 경우입니다. 그래서 일부러 100바이트 중간에 2바이트를 차지하는 한글이 딱 걸리게 입력해 보았습니다.

12345678901234567890123456789012345678901234567890123456789012345678901234567890
1234567890 먹겠습니다
※ 90자 + 공백 + 한글 5자 = 101바이트
이런... 지금까지 계속해서 나오던 카페에 있는 글이 나오지 않는군요. 아마도 '먹겠습니다'라는 검색어 중간에 100바이트를 넘어가면서 한글인코딩이 깨지게 되고 그에 따라 한글이 제대로 검색어로 입력되지 않았기 때문일 겁니다.

다른 검색사이트들은 어떻게 되어 있을까 궁금했지만.. 요즘 이래저래 바빠서리.. ^^;
Posted by : everyfishing

Trackback URL : http://zb5.co.kr/trackback/321 관련글 쓰기

Leave a comment

구글 서제스트의 추천 검색어는 얼마나 성인스러울까?

Posted 2010/02/24 12:39, Filed under : 서비스 다시보기, Posted by everyfishing
구글 검색창에 검색어를 입력하다보면 검색창 하단으로 구글 서제스트가 나타납니다. 구글 서제스트에서는 사용자가 입력한 단어를 포함한 추천 검색어들과 해당 추천 검색어들의 검색결과수를 함께 보여주고 있습니다. 이런 서제스트 기능은 각각의 엔진마다 약간의 차이는 있지만, 대다수의 검색엔진들이 채택을 하고 있죠. 구글에서는 2008년 하반기에 정식으로 서비스하기 시작했습니다.

국내의 검색엔진들은 이 서제스트를 굉장히 건전하게 운영하고 있는데, 구글의 경우는 좀 다르더군요. 그래서 구글 서제스트를 통해 구글의 추천 검색어가 얼마나 성인스러운지를 살펴봤습니다. 보시면 아시겠지만 참 난감한 추천 검색어들이 많더군요.

1. 일반적으로 가장 많이 검색하리라 생각되는 sex를 위해서 's'를 입력해 보았더니 아래와 같은 추천 검색어가 나타나더군요. 특이한 점이라면 'sex'와 '신'이라는 한글과 영어를 혼합한 검색어가 있군요. 
's'에 대한 구글 서제스트

's'에 대한 구글 서제스트


2. 키보드 자판에서 알파벳 s에 해당하는 한글 'ㄴ'을 입력해 보았더니 sex신을 추천합니다.
'ㄴ'에 대한 구글 서제스트

'ㄴ'에 대한 구글 서제스트


3. 한글 자음을 하나씩 넣어보다 보니 무척 난감한 추천검색어를 발견할 수 있었습니다. 'ㅊ'을 입력하니 '초딩누1드'라든가, '처제와 잠자리' 같은 검색어들이 나타나더군요.
'ㅊ'에 대한 구글 서제스트

'ㅊ'에 대한 구글 서제스트


4. 노골적으로 섹스를 검색해 보기 위해서 '섹'을 넣었더니 섹스보다는 '섹1스보기'같은 검색어가 먼저 나오더군요. '섹1스보기'로 많이들 검색을 하나 봅니다. 그런데 왜 '섹스'가 포함된 검색어가 나오지 않았나 생각해 봤더니, '섹스'보다는 '세계'가 순서 상으로 더 먼저더군요. 입력한 단어를 포함한 추천 검색어이기 때문에 '섹'을 '세ㄱ'으로 인식하는 거겠죠.
'섹'에 대한 구글 서제스트

'섹'에 대한 구글 서제스트


5. 위의 '섹'에 이어서 '섹스'를 모두 입력해 보았습니다. 그런데 이건 뭔가요? 아예 추천 검색어를 보여주지 않는군요. 아마도 추천 검색어가 없어서가 아니라 성인 키워드로 분류해서 금칙어 처리를 한 게 아닐까 합니다.
'섹스'에 대한 구글 서제스트

'섹스'에 대한 구글 서제스트


6. 금칙어는 '섹스'만이 아닌 듯 합니다. '야동', '조루', '콘돔' 같은 검색어들도 마찬가지로 구글 서제스트가 작동하지 않습니다. '야동'은 그럴 수 있다고 생각되는데, '조루'나 '콘돔' 같은 경우는 좀 실망스럽네요. 
'야동'에 대한 구글 서제스트

'야동'에 대한 구글 서제스트


'조루'에 대한 구글 서제스트

'조루'에 대한 구글 서제스트


'콘돔'에 대한 구글 서제스트

'콘돔'에 대한 구글 서제스트


7. '누드'의 경우도 금칙어에 해당하는 듯 하더군요. 그런데 중간에 공백을 넣은 '누 드'의 경우는 기대(?)하던 서제스트들인 '누드모음', '누드영상'이 노출되고 있습니다. 글자마다 공백이 하나씩 들어가 있기는 하지만요. 아마도 실제로 사용자들이 저런 식으로 공백을 넣어서 검색을 하고 있다는 증거일 듯 하네요.
'누드'에 대한 구글 서제스트

'누드'에 대한 구글 서제스트


'누 드'에 대한 구글 서제스트

'누 드'에 대한 구글 서제스트


8. '자위'를 확인해 보기 위해 '자우'까지 입력을 해보았더니 재미있는 서제스트가 등장하더군요. '자우1'로 시작하는 검색어들인데요, 사용자들이 '자위'라는 금칙어를 피해가기 위해서 '자우1'로 검색을 하고 있는 듯 합니다. 또한 '은꼴사'같은 단어들도 '은꼬르사'로 풀어서 검색하는 것으로 판단됩니다.
'자우'에 대한 구글 서제스트

'자우'에 대한 구글 서제스트


'은'에 대한 구글 서제스트

'은'에 대한 구글 서제스트


9. 구글 서제스트를 확인하다 보니 의외의 서제스트들을 만날 수 있었습니다. '간호사'나 '유부녀'같은 단어들에 등장하는 서제스트는 꽤나 질펀한 추천어들로 구성되어 있더군요. '간호사와 하룻밤'이나 '유부녀의 유혹' 같은 추천 검색어는 아마도 야설에 자주 등장하는 설정이라서 그런 듯 합니다. '콘돔' 같은 단어에는 아무런 추천 검색어를 노출하지 않으면서, '간호사' 같은 단어에 이렇게 노골적인 추천 검색어를 노출하는 것은 뭔가 기준이 없다는 느낌이 듭니다.
'간호사'에 대한 구글 서제스트

'간호사'에 대한 구글 서제스트


'유부녀'에 대한 구글 서제스트

'유부녀'에 대한 구글 서제스트


10. '유부녀' 같은 경우가 더 있을 듯 해서 찾아봤더니 꽤 많이 등장하더군요. '그녀' 같은 단어에 대한 추천 검색어는 거의 모두 성인급에 속하는 서제스트들입니다. '그녀의 꽃잎을 핥고'라든지 '그녀의 옷을 벗기고' 같은 낯뜨거운 서제스트들이 등장합니다. '남편'같은 경우도 '남편앞에서 범해져'같은 지나친 서제스트들이 뜨고, 특이하게 '남편 해바라기 수술'이라는 추천 검색어도 있더군요. '친구'나 '처제'같은 단어에도 '친구와이프먹기'라든가 '처제와의 비밀' 등의 야설의 단골 소재들이 등장하네요.
'그녀'에 대한 구글 서제스트

'그녀'에 대한 구글 서제스트


'남편'에 대한 구글 서제스트

'남편'에 대한 구글 서제스트


'처제'에 대한 구글 서제스트

'처제'에 대한 구글 서제스트


'친구'에 대한 구글 서제스트

'친구'에 대한 구글 서제스트


11. 개인적으로 유행에 민감하지 않은 터라 '슴ㅅ'까지 입력했을 때 등장하는 의외의 단어들에 놀라기도 했습니다. '슴시카'나 '슴세경', '슴선예'처럼 해당 연예인이 모욕적으로 받아들일 수 있는 단어들이 서제스트로 노출되더군요.
'슴ㅅ'에 대한 구글 서제스트

'슴ㅅ'에 대한 구글 서제스트


쭈욱 보셨겠지만 구글 서제스트에 등장하는 추천 검색어들은 국내 포털들인 다음, 네이버 등과는 꽤 다른 경향을 보이고 있습니다. 혹시나 해서 비교를 해보니 아무래도 다음, 네이버는 추천 검색어를 하나하나 체크하는 듯 하더군요. 과연 어떤 방식이 정답일까요? 솔직히 뭐가 정답이라고 딱부러지게 얘기하기는 어렵습니다. 다만 다들 더 좋은 서비스를 위해 노력하고 있을 거라고 생각해 봅니다.

Trackback URL : http://zb5.co.kr/trackback/298 관련글 쓰기

Leave a comment

네이버의 다이렉트 검색 업데이트

Posted 2009/12/17 13:35, Filed under : 약간은 짧은 글, Posted by everyfishing
네이버의 검색창에 입력하는 키워드 중에서 특정 키워드에 대해서 별도의 검색결과를 보여주는 것을 네이버에서는 다이렉트 검색이라고 하는가 봅니다. 그런데 다이렉트 검색이 이번에 업데이트 되었다고 하는군요.

네이버 다이렉트 검색 - 계산기

네이버 다이렉트 검색 - 계산기


기존의 다이렉트 검색에는 위와 같은 계산기를 포함해 달력, 우편번호, 지역 및 국가번호, 영문주소, 단위 변환, 세계시간, 택배조회, 경기결과, 은행이자, 일어 단문 번역, 특허 검색 등이 제공되었었는데, 이번에 아래와 같은 백과사전과 영화 전문 정보가 추가되었다고 합니다.

63빌딩 건립연도 다이렉트 검색

63빌딩 건립연도 다이렉트 검색


참고로 다음은 스마트 앤서라는 기능이 있지요. 그런데 솔직히 요즘 사람들이 '63빌딩 건립연도'를 더 궁금해 할까요? '이병헌 나이'를 더 궁금해 할까요? 이런 측면에서 보면 다음의 스마트 앤서가 네이버 다이렉트 검색에 비해서 인물 정보 쪽의 데이터에 강점을 가지고 있는 듯 합니다.

다음의 이병헌 나이 스마트 앤서 결과

다음의 이병헌 나이 스마트 앤서 결과



네이버의 이병헌 나이 검색 결과

네이버의 이병헌 나이 검색 결과


매일같이 연예인 이름이 인기 검색어를 차지하고 있는 요즘이니 앞으로 네이버도 인물 정보를 저 다이렉트 검색에 결합하리라 예상해 봅니다.

번외로 네이버의 이미지 섹션의 검색도 개편되었다고 하더군요. 최신 뉴스 이미지를 상단에 따로 보여주고, 이미지 크기 조절 및 시간순 정렬 등의 몇가지 옵션이 추가되었는데, 개인적으로는 느끼기에는 별 감흥이 없는 개편이군요.

Trackback URL : http://zb5.co.kr/trackback/272 관련글 쓰기

  1. # 타스케 2009/12/27 12:12 Delete, Reply

    빙이 괜히 다음과 연계한게 아닌가 봅니다 ^^;

Leave a comment