사람마다 블로그를 운영하는 목적이 다르겠지만
나는 검색되는 블로그를 만들고 싶다.
누군가가 모르는 것이 있을때 딱 검색을 해서 내 글을 보고 이해한다면
아주 만족스러울 것 같다.
지식은 소유하는 것이 아니라 나누는 것이라 생각하고,
특히 전문가가 될 수록 대중들이 이해하기 쉽도록 설명하는 노력이 필요하다고 생각한다.
그렇지 않으면 서로 이해를 하지 못하여
대중들은 전문가를 무시하고, 전문가는 대중을 고려하지 못한다.
블로그를 처음 시작한 건 2011년,
티스토리로 이사온 것은 2013년 1월 1일이다.
학업으로 인해 대학교 시절에는 거의 블로그를 방치해뒀고,
요즘은 시간이 좀 남아서 블로그를 짬짬히 쓰고 있다.
언젠가 또 바빠지면 방치되겠지만
내 블로그의 장점은 검색으로 들어오는 자들이 많아서 방치되어도 조회수가 꽤 나온다.
특히, 시험기간.
방학과 주말에는 조회수가 떨어진다.
그런데 진짜 그럴까?
내가 생각하는 것처럼 방학과 주말에 조회수가 감소하는 것이 맞을까?
이 가설을 설명하기 위해 블로그 방문자수 데이터를 토대로 ChatGPT와 함께 시계열 분석을 돌려보았다.
(시계열 분석에 대해서는 GPT와 함께가 아니라 스스로 코드를 짤 수 있을 때가 되면 블로그에 정리하겠다.)
우선 2013년 1월 1일부터 2024년 11월 22일까지의 조회수를 기반으로 그래프를 그려보았다.
...뭐야 저 2019년 언젠가 왜 저렇게 조회수가 많아?
찾아보니 어디 커뮤니티에 '이 블로그 보니까 어쩌어쩌하더라~'라고 참고되어 있었다.
와, 커뮤니티의 위력이 크구나...!
아웃라이어를 빼고 분석을 하는 것이 아무래도 더 정확할 것 같아서
아웃라이어를 점으로 표시하고, 나머지를 꺾은선으로 그려보았다.
...음, 꽤 많네?
이제 전체 데이터로 분석한 값과 아웃라이어를 제외하고 분석한 결과를 그려보겠다.
일단 365일을 기준으로 연 단위 계절성을 분석해보았다.
참고로 나는 2019년 중반부터 2023년 중반까지 블로그를 방치했다.
의대는 방학도 거의 없고 시험도 1~2주마다 본단 말이에여 흑흑
그 결과, Trend를 보면 그 시기의 조회수가 팍 내려가 있다.
Seasonal 부분 그래프를 봤을 때 주기성이 있는 것 같다.
1년에 그래프가 2번 패이는 것 보니 방학에 감소하는게 맞을 것 같은데....
어쨌든 주기성이 있는지 확실히 하기 위해 Ljung-Box test를 해서 p value를 살펴보았다.
p value가 0.05보다 작으니 주기성은 확실히 있다.
즉, 매년 비슷한 시기에 조회수가 증가하고 비슷한 시기에 감소한다.
그렇다면 주말에 조회수가 유의하게 감소하는지 분석을 해봐야겠다.
토, 일을 주말로 잡고 SARIMA 모델을 돌려보았다.
일해라 ChatGPT!!
...xreg가 -33.04이니 대략 주말에 33회 정도의 조회수 감소가 있다는 것이군...
그렇다, 내 블로그는 주말에 유입수가 확실히 감소한다.
앞으로 생성형 AI의 발달로 검색 엔진을 쓰는 사람들이 감소할지,
그래서 궁극적으로는 블로그 방문자 수의 감소로 이어질지
늘 궁금하다.
일단 고려해야 할 변수가 매우 많으니 당장 분석은 못 할 것 같다.
언젠가 자료가 쌓이면 분석할 수 있겠지!
cf. 약간 유명한 과학자들이 하는 것처럼 영문 블로그도 운영해 보고 싶은데... 너무 욕심이려나 ㅋㅋㅋ
아직 진로가 명확하지 않은 꼬꼬마라서...