
텍스트 마이닝과 토픽 모델링을 이용한 성조숙증 관련 인터넷 건강상담 분석
Abstract
This study aimed to investigate the characteristics of the demand for precocious puberty-related health information using the text data of online health counseling through the techniques of text mining and topic modeling.
The input data of this study were question and answer documents that were searched for Naver Jisik-iN using the keywords 'precocious puberty'. The documents were automatically collected using a web crawler from January 2017 to June 2019. We performed text pre-processing, after which all nouns were extracted using a morphological analyzer. LDA(Latent Dirichlet Allocation) topic modeling was performed to find hidden themes in the text.
A majority of questions were submitted during the school vacation. Approximately half of all questions were answered by doctors. We used LDA topic modeling to yield three themes regarding precocious puberty-related questions: 1) asking for expert opinion on diagnosis or hospital selection, 2) questions regarding diagnostic tests and treatment, and 3) questions considering obesity and/or diet, as well as timing of puberty onset.
This study identified the major precocious puberty-related concerns. In light of the increasing incidence of precocious puberty, individuals with this condition, as well as parents, should be provided with appropriate education to promote awareness and management.
Keywords:
precocious puberty, text mining, topic modeling, health educationⅠ. 서론
성조숙증은 2차 성징이 기대 연령보다 빨리 이루어지는 것으로 정의되며, 임상적으로 여아는 8세 미만, 남아는 9세 미만에서 2차 성징이 나타나는 것을 말한다(Berberoğlu, 2009; Kim, 2018). 아동의 성조숙증은 신체적 문제 뿐 아니라 또래와 다른 체형으로 인한 스트레스, 이로 인한 교우관계 문제 및 성범죄의 노출 가능성 등 여러 심리사회적 문제를 초래할 수 있다(Johansson & Ritzén, 2005; Tremblay & Frigon, 2005). 전세계적으로 최근 출생 코호트가 과거에 비해 성적 성숙이 빨라지는 경향은 공통적으로 관찰되어 왔으나(Kim, 2018), 국내 성조숙증 발생률의 증가세는 굉장히 가파르다. 건강보험심사평가원의 보험청구자료를 분석한 김 (2019)의 연구에 따르면 국내 성조숙증 발생률은 2010년에서 2014년까지 여아는 10만명당 89.4명에서 415.3명으로, 남아는 10만명당 1.6명에서 14.7명으로 증가하였다고 보고하였다(Kim et al., 2019). 연구대상과 시기에 따라 편차가 있지만 해외 성조숙증 발생률이 인구 10만명당 10명 (González, 1982; Krstevska-Konstantinova et al., 2001) 수준임을 고려하면 국내 성조숙증 환자 발생률은 매우 높은 수준임 알 수 있다.
대부분의 성조숙증은 특발성으로 직접적인 원인을 알지 못하는 경우가 많다. 그러나 일부는 중추신경계나 내분비계의 종양이 원인이 된 경우도 있어 전문의의 정확한 진단과 치료는 중요하다(Lee et al., 2011). 성조숙증의 진단과정에는 X-ray, 뇌 MRI, 복부 초음파, GnRH(gonadotropin-releasing hormone) 자극검사 등 다양한 검사들이 수반되고 (Lee et al., 2011; Rhie & Lee, 2015), 치료를 위해서는 통상 2년 이상의 성호르몬 억제제(GnRHa)의 주사 투여가 필요하다(Lee et al., 2011). 높은 질환 발생률, 복잡한 진단검사와 장기간의 침습적 치료과정은 환아와 가족들의 정보 요구도를 높일 것으로 예상되지만 이에 대한 연구는 매우 제한적이다. 일부에서 이루어진 국내 선행연구들은 주로 환아와 아동을 돌보는 어머니의 경험에 국한되어 있고 연구대상자도 일개 병원 방문자와 같은 편의추출에 의존하고 있다(Chun & Jung, 2019; Lee, Ju, & Kwak, 2015).
통신기술의 발전과 여러 디지털 기기의 보급으로 방대한 양의 텍스트 데이터가 온라인 상에 축적되고 있다. 이에 따라 최근에는 보건의료 분야에서도 온라인 텍스트 정보를 전염병 감시(surveillance) 혹은 환자의 건강상담/치료경험 분석에 활용하고자 하는 시도들이 이루어지고 있다(Adusumalli et al., 2015; Park & Hong, 2018; Sadah, Shahbazi, Wiley, & Hristidis, 2016). 국내에서 주로 활용된 온라인 자료원으로는 트위터, 인터넷 블로그, 카페(Song, Song, Seo, Jin, & Kim, 2017; Song, Song, Seo, & Jin, 2016; Woo et al., 2016)와 네이버 지식인(Kim, Park, & Ji, 2016; Kim & Lim, 2013; Oh, Shin, & Hwang, 2018) 등이 있으며, 이 중 네이버 지식인은 연간 2천만건 이상의 질문과 6천건 이상의 답변이 등록되는 국내 대표적인 지식교류 서비스이다(Naver). 건강관련 질의응답도 활발히 이루어져 2002년 서비스 시작 이후 최근까지 건강관련 누적 질문 수는 2억건을 상회한다.
이와 같은 방대한 양의 온라인 텍스트 데이터에서 의미있는 주제와 내용을 도출하기 위해 활용할 수 있는 방법으로는 텍스트 마이닝(text mining)기법을 들 수 있다. 텍스트 마이닝은 비정형 데이터를 수집하고 분석하기 위한 기법으로, 키워드 분류, 나열, 요약의 일련의 과정을 통해 새로운 패턴을 찾아내는 과정이다(Lee & Lee, 2015). 이 중 LDA(Latent Dirichlet Allocation) 토픽 모델링(topic modeling) (Blei, Ng, & Jordan, 2003)은 베이지안 추론(Bayesian inference)을 기반으로 텍스트 데이터의 특정 주제를 추출하는 알고리즘으로, 최근의 학술연구에서 활용빈도가 높은 대표적인 텍스트 마이닝 분석방법 중 하나이다(Kim, Cho, & Kang, 2016).
따라서 본 연구는 네이버 지식인에 등록된 성조숙증 관련 질의 응답을 텍스트 마이닝과 토픽 모델링을 통해 분석함으로써 성조숙증 환자와 가족들이 필요로 하는 건강정보의 특성을 살펴보고, 이들의 주요 주제와 핵심어를 도출하고자 하였다.
Ⅱ. 연구방법
1. 연구방법 개요
[Figure 1]은 연구방법의 흐름을 단계별로 제시하였다. 1단계는 입력(input) 자료 생성과정으로, 이 연구는 네이버 지식인에 ‘성조숙증’의 키워드로 검색된 질의 문서들을 웹 크롤러(Web crawler)를 이용하여 자동 수집하였다. 2단계는 실제 텍스트 분석에 활용할 데이터셋(Dataset)를 생성하는 과정으로 전체 질의 문서 중 텍스트 내에 ‘성조숙증’ 키워드를 포함한 문서만 선정하였다. 3단계는 전처리 과정으로 자동 띄어쓰기, 정제, 불용어 처리 등의 텍스트 전처리 후 명사만을 추출하여 토픽모델링에 사용할 Bag of words(BoW)를 생성하였다. 4단계로 LDA 토픽 모델링 수행한 후, 5단계에서 해당 결과들을 시각화하여 토픽 간 독립성과 토픽 키워드의 연관성을 확인하는 과정을 거쳤다. 본 연구는 경북대학교 생명윤리위원회의 심의를 받았다(승인번호: KNU 2018-0141).
2. 데이터 수집 및 구축과정
본 연구는 2017년 1월부터 2019년 6월까지 네이버 지식인에 ‘성조숙증’을 키워드로 검색된 질문과 답변을 대상으로 하였다. 관찰기간 동안 네이버에 등록된 질문과 답변은 웹 크롤링(web crawling) 기법을 이용하여 수집하였고, 파이썬(Python)의 requests 와 BeautifulSoup 모듈을 사용하였다. 크롤링된 질문의 수는 2017년 2950건, 2018년 2027건, 2019년 822건으로 대상기간 동안 등록된 질문의 총 수는 5799건 이었다. 그러나 연구진의 검토결과 네이버 지식인에서 ‘성조숙증’으로 검색된 질문 중 상당수 실제 성조숙증에 대한 질문이 아니었다. 따라서 이 중 질문의 제목과 내용 중 ‘성조숙증’이란 단어가 한번도 언급되지 않은 3565건의 질문을 1차 배제하였고, 연구자가 질문의 내용을 확인하여 성조숙증 환자와 가족의 교육 요구와 무관한 질문(ex. 단순 보험상품 문의/광고, 성조숙증 영어 번역 요청 등) 81건를 추가 제외하였다. 네이버 지식인은 질문자의 개인 정보를 습득할 수 없으므로, 동일한 사람이 여러 개의 중복 질문을 올렸을 가능성이 있다. 따라서 중복질문을 배제하기 위하여 TF-IDF(Term Frequency-Inverse Document Frequency) (Manning, Raghavan, & Schütze, 2008) 벡터(vector)의 코사인 유사도(Cosine Similarity) (Manning et al., 2008)를 이용하였고, 유사도 90% 이상의 문서(718건)는 동일 질문으로 간주하여 분석 자료에서 제외하였다. 이를 통해 최종적으로 선정된 성조숙증 관련 질문은 1435건 이었다.
선정된 질문들은 텍스트 전처리 과정을 통해 이후 사용될 분석기법에 적합한 형태의 데이터로 변환되어야 한다. 네이버 지식인의 질문들은 일반인들이 자발적으로 올린 사적인 상담 글이기 때문에 공식적 문서들과는 달리 은어, 비속어와 같은 비표준어 사용이 빈번하고, 띄어쓰기가 온전하지 않은 글도 상당히 많다. 크롤링에서 얻어진 텍스트 데이터는 일차적으로 Python의 kospacing 모듈을 이용하여 자동 띄어쓰기 처리 수행하였다. 이 후 특수기호, 영어, 숫자, 한 글자 단어는 제외하였고, ‘성조숙증’, ‘네이버’, ‘내공’ 등의 상담내용과 관련없는 네이버 이용자의 특정 용어, 지역명과 특정 병원 이름은 불용어(stop-words) 처리하였다. 형태소분석(Manning et al., 2008)은 형태소를 비롯한 다양한 언어적 속성의 구조를 파악하는 것으로, 본 연구에서는 3개 형태소 분석기(Khaii, ETRI, Okt)의 품사 태깅 결과를 검토 한 후 Konlpy 패키지내의 Okt 를 연구에 최종 사용하였다. Okt를 사용한 어간추출(Steming)과 품사태깅 작업을 통해 기타 품사를 제외한 명사만을 이후 분석에 사용하였다.
3. 토픽 모델링의 적용
추출된 명사는 출현 빈도(frequency) 기반의 단어 집합인 Bag of Words(BoW)로 변환 후 LDA 토픽 모델링을 위해 서로 다른 문서들의 BoW를 결합한 문서 단어 행렬(Document-Term Matrix, DTM)을 생성하였다. LDA 분석을 위해 문서 간 중복성이 없는 단어는 분석에서 제외한 후 2회 이상의 빈출 단어만을 분석에 사용하였다.
LDA 토픽 모델링(Blei et al., 2003)은 성조숙증 환자와 가족의 상담문서들의 숨겨진 주제를 확률을 기반으로 객관적으로 찾기 위해 사용되었다. LDA의 알고리즘은 각 문서는 잠재적 토픽들이 확률적으로 혼합되어 있다고 간주하며, 각 토픽은 단어들의 분포로써 특징 지어진다. 이후 베이지안 추론(Beysian inference)을 기반으로 실제 텍스트 데이터 분포와 사전확률을 토대로 반복적인 샘플링 과정을 통해 토픽과 단어들의 확률을 연산한다. LDA 분석은 R 프로그램의 LDA 패키지를 이용하여 수행하였다(Team, 2013).
최적의 토픽 모델을 선정하기 위하여 최소 2개에서 최대 20개까지 다양한 토픽 수를 지정 하여 LDA 토픽 모델링을 수행 후 결과물을 비교검토 하였다. 이 작업에는 LDA 토픽모델의 시각화 모듈인 LDAvis 활용하여(Sievert & Shirley, 2014), 다차원의 주제간 거리 지도(Inter-topic distance map via multidimensional scale)와 연관성 추정치(relevance estimate)를 기준으로 상위에 랭크된 키워드를 기준으로 주제와 단어의 관련성을 확인하였다.
4. 토픽 별 최종 키워드와 상담사례 제시
LDAvis의 결과를 토대로 토픽간의 독립성이 가장 높으며, 토픽의 키워드간 관련성이 높은 모델을 최적의 모델로 선정하여, 최종적으로 3개의 주제별 20개의 키워드를 도출하였다.
본 연구는 단일 단어(uni-gram)를 기본 단위로 토픽 모델링을 수행하여, 문장 혹은 문서 전체의 맥락을 파악하는 데는 한계가 있다. 따라서 각 문서 별로 가장 높은 확률의 토픽을 기록한 후, 각 토픽 별로 할당된 문서의 원본 질문의 전체 질문 내용을 확인하여 토픽 별 질문의 전체 맥락과 특성을 파악하고자 하였다.
Ⅲ. 연구 결과
1. 네이버 지식인에 등록된 성조숙증 관련 질문의 양과 답변자 특성, 시기별 분포
2017년 1월에서 2019년 6월까지 네이버 지식인에 등록된 성조숙증 관련 질문은 2017년 625건, 2018년 514건, 2019년 296건으로 총 1435건이 확인되었다<Table 1>. 이들 중 1개 이상의 답변이 등록된 질문은 총 1418건으로 전체 질문의 99%가 답변이 등록되어 있었다. 응답자의 분포를 살펴보면 일반인이 55.9%, 네이버 등록 전문가는 44.1%로 전문가 답변이 절반가량을 차지하였다. 전문가 응답자의 특성을 살펴보면 전체 관찰 기간 응답자의 분포는 의사가 많았으나, 한의사의 응답 비중이 최근 3년 사이 빠르게 증가하고 있는 것을 확인 할 수 있었다. [Figure 2]는 성조숙증 관련 질문의 연도별ㆍ월별 분포를 나타낸다. 네이버 지식인의 질문 등록은 학생들의 방학시기인 1-2월과 8월에 가장 높았다.
2. 성조숙증 관련 질문의 키워드와 주요 주제 탐색
성조숙증 관련 질문에서 추출된 명사 중 최다 빈출 단어는 ‘호르몬’, ‘몸무게’, ‘초등학교’, ‘뼈 나이’, ‘성장판’으로 초등학생의 성조숙증 진단 검사와 관련된 질문이 많았다<Supplementary table 1>. 질문에서 언급된 단어들을 보다 자세히 확인하기 위해 5회 이상의 모든 빈출 단어들은 워드 클라우드(Word cloud)로 제시하였다[Supplementary figure 1].
<Table 2>는 LDA 토픽 모델링을 통해 도출한 성조숙증 관련 질문들의 3개 주요 주제와 주제별 최다 빈출 단어 10개를 나열한 것이다. 주요 단어들을 토대로 Topic 1을 살펴보면, 초등학생, 여자 어린이의 성조숙증 관련하여 전문가 의견을 구하는 질문이 많은 것으로 추정된다. 또한 Topic 1의 키워드 중 한의원이 3번째로 많이 나타난 것을 고려할 때, 성조숙증의 한방치료에 대한 관심도가 상당히 높은 것으로 보인다. Topic 2는 호르몬, 뼈 나이, 엑스레이, 억제제, 초음파 등 주로 성조숙증 검사와 치료에 대한 질문이 주를 이루는 것으로 보인다. Topic 3은 몸무게, 줄넘기, 다이어트의 키워드를 토대로 할 때 비만과 다이어트 관련 질문이 성조숙증 환자와 보호자들의 주된 관심영역 중 하나임을 확인 할 수 있었고, 중학교, 여드름, 겨드랑이, 브래지어 등의 키워드를 고려할 때 성조숙증 치료 후 2차 성징 발현 시기에 대한 질문도 상당수 존재하는 것으로 생각된다. 각 토픽간 다차원의 주제간 거리지도와 연관성 추정치(relevance estimate)를 기초로 한 주요 단어리스트는 부록에 제시하였다[Supplementary figure 2-3].
<Table 3>은 각 토픽에 해당하는 성조숙증 관련 질문의 실제 사례를 제시한 결과이다. Topic 1의 주요 사례들을 살펴보면, 성조숙증을 의심하는 어린이가 본인의 신체발달 상황 혹은 성적 성숙과정이 성조숙증 질환에 해당하는지 의견을 구하는 질문과 성조숙증이 의심되는 어린이의 성인 가족이 아이의 증상과 신체발달 상황을 서술하며 좋은 치료기관을 알려달라는 질문들이 많은 것을 확인 할 수 있었다. Topic 2의 질문은 성조숙증 진단검사에 대한 질문, 진단 후 치료를 받아야 하는지 상담하는 질문과 성조숙증 치료과정에서 주의해야 할 점이나 부작용 등을 묻는 질문들이 주로 분포하고 있었다. Topic 3는 비만한 아동의 다이어트 관련 질문과 더불어 비만으로 인해 성조숙증이 생길 수 있는지 걱정하는 상담내용과 성조숙증 치료 후 2차 성징이 언제쯤 나타날지 혹은 현재의 신체 상태가 2차 성징에 해당하는지 묻는 질문으로 구성되어 있음을 확인할 수 있었다. 각 토픽 간의 독립성을 표현하는 다차원 주제간 거리지도와 주요 연관 단어 30개의 리스트들은 부록에 제시하였다[Supplementary figure 2-3].
Ⅳ. 논의
본 연구는 성조숙증 환자와 가족들이 네이버 지식인에 올린 질문들의 텍스트 분석을 통해 이들의 온라인 상담 특성을 파악하고, 상담의 주요 주제별로 키워드와 실제 질문사례들을 살펴보았다. 연구결과 연간 500건 이상의 성조숙증 관련 상담 질문이 네이버 지식인에 게시되고 있었고 대다수의 질문에 답변이 등록되어 온라인 건강상담이 활발히 이루어지고 있는 것을 확인할 수 있었다. 질문 응답자의 절반가량은 전문가 집단으로 조사되었고, 한의사의 건강상담 사례는 일반 의사보다 적었으나 최근 3년간 빠르게 증가하는 경향을 보였다. 빈출 단어 분석에서도 한의원이 8위에 랭크되었다. 질문의 주요 주제는 초등학교 여자 어린이의 성조숙증 관련 전문가 의견 요청(치료기관, 부작용 포함), 성조숙증 검사결과와 치료관련 문의, 비만/다이어트와 2차 성징이 나타나는 시기에 대한 것이었다.
네이버 지식인의 건강 상담 사례들을 살펴보면, 주요 빈출 단어 10위안에 ‘한의원’이 랭크 되어 한방 치료에 대한 관심이 높음을 확인할 수 있었다. 성조숙증의 침습적 치료과정에서 느끼는 부담감과 장기 호르몬 치료의 부작용 발생 우려가 대안적 치료방법 중 하나인 한방치료에 대한 관심을 높인 것으로 추정된다. 그러나 답변자 중 한의사의 비율이 최근 급격히 증가하고 있음을 고려할 때, 한방치료에 대한 관심은 환자와 보호자의 요구뿐 아니라 한의사들의 적극적 자문활동도 영향을 미치고 있는 것으로 생각된다. 실제로 네이버 지식인의 한방 상담현황을 분석한 선행 연구에서도 한의학 분야의 전문가 수는 일반 의사에 비해 소수였으나, 2012년 기준 한의사 1인당 답변 수가 평균 약 90건에 이르는 등 적극적으로 활동을 하고 있다고 보고된 바 있다(Kim & Lim, 2013). 온라인 상담으로 인한 한방 진료의 증가가능성에 대해서도 향후 연구를 통해 추가적인 논의가 필요할 수 있다.
성조숙증 관련 질문들의 주요 주제는 아동의 현재 신체발달 상황이 성조숙증에 해당하는지에 대해 전문가 의견을 묻는 것이었다. Topic 1의 빈출 단어에서 확인한 바와 같이 질문의 대상연령은 초등학생, 성별은 여자아이였다. 해당 토픽의 등록 질문의 전체 텍스트를 확인해보면, 보호자가 올린 질문뿐 아니라 아동 본인이 자신의 신체적 변화가 성조숙증에 해당하는지 묻는 질문도 상당수 존재하였다. 학령기 아동은 신체적 차이점을 인식하게 되어 주변 친구들과의 신체적 차이에 대해 민감하게 반응하게 되나(Chun & Jung, 2019), 신체변화를 수용하고 이해할 수 있는 능력은 부족하여 신체적 변화에 대한 두려움과 혼란스러운 감정을 경험하게 된다(Mendle, Turkheimer, & Emery, 2007). 초등학교의 학교 성교육은 연간 15시간 이상을 의무 실시하도록 규정하고 있으나, 실제 교육 현장에서 성교육 시간을 편성하여 운영하는 비율은 매우 낮았다(Jin & Park, 2011; Kim, Kang, & Lee, 2018). 따라서 이 결과는 성 인지도가 낮은 초등학교 저학년 아동들의 미충족된 교육 요구가 온라인 매체를 통해 표출되고 있는 것으로 해석할 수 있다. 따라서 본 연구결과를 토대로 할 때 성조숙증에 대한 이해를 높이기 위한 초등학교 학생과 학부모를 대상으로 한 성교육이 필요할 것이다.
Topic 2는 성조숙증 검사ㆍ치료 과정에서 보호자들의 올린 질문이 주를 이루고 있었다. 등록된 질문의 전체 내용을 살펴보면, 환아의 보호자들이 검사결과의 수치들을 제시하며, 검사 결과의 의미와 진단의 정확성을 재확인 하는 내용이 많았다. 이 결과는 치료기관에서 성조숙증 환아의 보호자들이 충분한 정보를 제공받지 못하고 있음을 시사한다. 실제로 성조숙증 아동의 어머니를 대상으로 한 연구에서도 이들의 성조숙증 관련 교육 경험율은 낮았고, 교육 요구도는 매우 높은 것으로 조사되었다(Lee et al., 2015). 더불어 성조숙증 치료 종결 이후의 생활과 신체적 성장에 대해서도 많은 질문이 있었던 점을 고려할 때, 치료 완료 후 환아와 보호자들이 관련한 정보를 획득할 수 있는 적절한 정보전달 통로가 부족함을 보여준다. 따라서 의료기관에서는 환자와 보호자를 대상으로 적절한 건강정보를 제공할 수 있는 프로그램 마련이 필요하며, 치료 종결 후의 추후 관리 방안에 대한 모색도 필요하다.
그러나 본 연구는 다음의 제한점을 가진다. 첫째, 일개 인터넷 포털 사이트의 질의내용을 연구대상으로 하여 인터넷 포털 사이트의 선호 경향에 따라 연구대상자의 선택편향이 발생했을 수 있다. 또한 온라인 매체에 대한 접근성이 떨어지는 취약계층은 연구대상에서 배제되었을 가능성이 크다. 둘째, 본 연구는 uni-gram 단위의 명사만을 분석대상으로 한정하여, 문장의 전체적인 맥락을 정확히 파악하기 어려운 한계를 가진다. 이 연구에서는 이러한 한계점을 극복하기 위하여, 토픽별로 할당된 문서의 전체 질의 내용을 재확인하여 질문의 전체적인 내용과 주제 도출간의 일치도를 높이고자 하였다. 그러나 단일 단어들의 조합으로 주요 주제를 추론하는 과정은 연구자의 주관성이 온전히 배제하기 어렵다. 추후 연구에서는 두개(bi-) 혹은 세개(tri- gram) 단어 단위의 분석을 통해 문장의 맥락을 반영한 토픽 모델링을 수행할 필요가 있다.
Ⅴ. 결론
이 연구는 성조숙증 관련 인터넷 상담내용을 분석하여, 온라인 건강상담의 현황과 이들의 주요한 주제를 파악할 수 있었다. 온라인 상담의 절반 가량이 관련 전문가에 의해 답변이 이루어지고 있는 점은 보건교육의 매체로써 온라인 건강상담이 유용한 방안이 될 수 있음을 시사한다. 그러나 동시에 절반 가량의 성조숙증 관련 질문이 비전문가에 의한 답변 임을 고려할 때 부정확한 건강정보의 확산으로 인한 폐해도 우려될 수 있다. 또한 상담 내용의 주요 주제가 진단검사 및 치료에 대한 질문 임을 고려할 때 성조숙증 환아와 보호자에게 의료진의 적절한 건강정보 제공이 이루어지고, 의료기관에서 체계적인 교육 프로그램을 마련할 필요성이 있음을 확인할 수 있었다. 최근 높아지는 성조숙증 발생률을 고려하여 초등학교 저학년 학생과 학부모가 정상적인 신체적 성숙과정과 성조숙증을 구분할 수 있도록 보다 적극적인 성교육이 이루어져야 할 것이다. 향후 소셜 네트워크를 비롯한 다양한 온라인 매체를 활용한 후속 연구들이 이루어진다면, 성조숙증 환아와 가족을 위한 실제적 교육 프로그램 마련의 기초자료로 활용할 수 있을 것이다.
Acknowledgments
이 논문은 2019년도 정부(교육부)의 재원으로 한국연구재단의 지원을 받아 수행된 기초연구사업임(No. 2019R1I1A1A01046991)
References
-
Adusumalli, S., Lee, H., Hoi, Q., Koo, S.-L., Tan, I. B., & Ng, P. C. (2015). Assessment of web-based consumer reviews as a resource for drug performance. Journal of medical Internet research, 17(8), e211.
[https://doi.org/10.2196/jmir.4396]
-
Berberoğlu, M. (2009). Precocious puberty and normal variant puberty: Definition, etiology, diagnosis and current management. Journal of clinical research in pediatric endocrinology, 1(4), 164-174.
[https://doi.org/10.4274/jcrpe.v1i4.3]
- Blei, D. M., Ng, A. Y., & Jordan, M. I. (2003). Latent dirichlet allocation. Journal of Machine Learning Research, 3(Jan), 993-1022.
-
Chun, S. M., & Jung, H. Y. (2019). Experience of precocious puberty in primary school girls with hormone therapeutics. The Journal of Korean Academic Society of Nursing Education, 25(4), 459-470.
[https://doi.org/10.5977/jkasne.2019.25.4.459]
-
González, E. R. (1982). For puberty that comes too soon, new treatment highly effective. The Journal of the American Medical Association, 248(10), 1149-1155.
[https://doi.org/10.1001/jama.1982.03330100003001]
-
Jin, H. S., & Park, H. R. (2011). Sexual knowledge and perception and current status of sex education among parents of first and second grade elementary schoolers. Child Health Nursing Research, 17(3), 198-205.
[https://doi.org/10.4094/jkachn.2011.17.3.198]
-
Johansson, T., & Ritzén, E. M. (2005). Very long-term follow-up of girls with early and late menarche. In H. A. Delemarre-van de Waal (Ed.), Abnormalities in puberty (Vol. 8, pp. 126-136). Basel: Karger Publishers.
[https://doi.org/10.1159/000084098]
- Kim, H., Park, J. H., & Ji, E. (2016). Pattern of pharmacist consultation among the health counseling services via Internet portal sites: A pilot study. Korean Journal of Clinical Pharmacy, 26(4), 324-329.
-
Kim, S.-J., Kang, S.-R., & Lee, J. M. (2018). Development of a sexual abuse prevention education program for elementary school students using a hybrid application. Child Health Nursing Research, 24(1), 109-118.
[https://doi.org/10.4094/chnr.2018.24.1.109]
- Kim, S. G., Cho, H. J., & Kang, J. Y. (2016). The status of using text mining in academic research and analysis methods. The Journal of Information Technology and Architecture, 13(2), 317-329. UCI: G704-SER000010357.2016.13.2.010.
-
Kim, S. Y. (2018). Etiology and treatment of central precocious puberty. Journal of the Korean Medical Association, 61(10), 591-598.
[https://doi.org/10.5124/jkma.2018.61.10.591]
- Kim, Y.-K., & Lim, B. (2013). Internet health counseling for Korean medicine in the NAVER Jisik-iN. Journal of Society of Preventive Korean Medicine, 17(1), 51-63. UCI: G704-002177.2013.17.1.006.
-
Kim, Y. J., Kwon, A., Jung, M. K., Kim, K. E., Suh, J., Chae, H. W., . . . Kim, H. S. (2019). Incidence and prevalence of central precocious puberty in Korea: an epidemiologic study based on a national database. The Journal of Pediatrics, 208, 221-228.
[https://doi.org/10.1016/j.jpeds.2018.12.022]
-
Krstevska-Konstantinova, M., Charlier, C., Craen, M., Du Caju, M., Heinrichs, C., de Beaufort, C., . . . Bourguignon, J. P. (2001). Sexual precocity after immigration from developing countries to Belgium: Evidence of previous exposure to organochlorine pesticides. Human Reproduction, 16(5), 1020-1026.
[https://doi.org/10.1093/humrep/16.5.1020]
-
Lee, J. H., & Lee, H. K. (2015). A study on unstructured text mining algorithm through R programming based on data dictionary. Journal of the Korea Industrial Information Systems Research, 20(2), 113-124.
[https://doi.org/10.9723/jksiis.2015.20.2.113]
-
Lee, J. Y., Ju, H. O., & Kwak, M. J. (2015). Disease-related characteristics of children with precocious puberty and their mothers educational needs in a general hospital of Korea. Journal of the Korean Society of Maternal and Child Health, 19(2), 279-288.
[https://doi.org/10.21896/jksmch.2015.19.2.279]
- Lee, K. Y., Kim, C. J., Kim, H. S., Shin, C. H., Yang, S., Lim, J. S., . . . Hwang, J. S. (2011). Clinical guidelines for precocious puberty. The Korean Society of Pediatric Endocrinology.
-
Manning, C. D., Raghavan, P., & Schütze, H. (2008). Introduction to information retrieval: Cambridge university press.
[https://doi.org/10.1017/CBO9780511809071]
-
Mendle, J., Turkheimer, E., & Emery, R. E. (2007). Detrimental psychological outcomes associated with early pubertal timing in adolescent girls. Developmental review, 27(2), 151-171.
[https://doi.org/10.1016/j.dr.2006.11.001]
- Naver. Naver Jisik-iN. Retrieved from https://kin.naver.com/
-
Oh, S. H., Shin, N. R., & Hwang, S. J. (2018). Analysis of online questions about dental hygienist: case report in Naver Intelligent Network. Oral Biology Research, 42(1), 62-66. UCI: I410-ECN-0102-2018-500-004081092.
[https://doi.org/10.21851/obr.42.01.201803.62]
-
Park, S. H., & Hong, S. H. (2018). Identification of primary medication concerns regarding thyroid hormone replacement therapy from online patient medication reviews: Text mining of social network data. Journal of Medical Internet Research, 20(10), e11085.
[https://doi.org/10.2196/11085]
- R Core Team (2014). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. URL http://www.R-project.org/, .
-
Rhie, Y. J., & Lee, K. H. (2015). Overview and treatment of precocious puberty. Journal of the Korean Medical Association, 58(12), 1138-1144.
[https://doi.org/10.5124/jkma.2015.58.12.1138]
-
Sadah, S. A., Shahbazi, M., Wiley, M. T., & Hristidis, V. (2016). Demographic-based content analysis of web-based health-related social media. Journal of Medical Internet Research, 18(6), e148.
[https://doi.org/10.2196/jmir.5327]
-
Sievert, C., & Shirley, K. (2014). LDAvis: A method for visualizing and interpreting topics. In Jason Chuang, Spence Green, Marti Hearst, Jeffrey Heer, Philipp Koehn (Eds.), The Proceedings of the Workshop on Interactive Language Learning, Visualization, and Interfaces (pp. 63-70). Maryland, BA: Association for Computational Linguistics.
[https://doi.org/10.3115/v1/W14-3110]
-
Song, J., Song, T. M., Seo, D.-C., Jin, D.-L., & Kim, J. S. (2017). Social big data analysis of information spread and perceived infection risk during the 2015 Middle East respiratory syndrome outbreak in South Korea. Cyberpsychology, Behavior, and Social Networking, 20(1), 22-29.
[https://doi.org/10.1089/cyber.2016.0126]
-
Song, J., Song, T. M., Seo, D.-C., & Jin, J. H. (2016). Data mining of web-based documents on social networking sites that included suicide-related words among Korean adolescents. Journal of Adolescent Health, 59(6), 668-673.
[https://doi.org/10.1016/j.jadohealth.2016.07.025]
-
Tremblay, L., & Frigon, J.-Y. (2005). Precocious puberty in adolescent girls: a biomarker of later psychosocial adjustment problems. Child Psychiatry and Human Development, 36(1), 73-94.
[https://doi.org/10.1007/s10578-004-3489-2]
-
Woo, H., Cho, Y., Shim, E., Lee, J.-K., Lee, C.-G., & Kim, S. H. (2016). Estimating influenza outbreaks using both search engine query data and social media data in South Korea. Journal of Medical Internet Research, 18(7), e177.
[https://doi.org/10.2196/jmir.4955]