6/2/23
지난 10여년의 언론 데이터 분석
찾기: 주제어 중심의 의미 파악 ->
시계열 묶기: (중장기) 트렌드 파악 - >
수집 및 (단기)목록화: 의미적 요약기법 개발
문제의식:
당면이슈
########################
# 후쿠시마 포함 제목 분석#
# last_24_hours: 가상의 언론 데이터셋
# 제목(title), 본문(body)
########################
last_24_hours %>%
filter(str_detect(title,"후쿠시마")) %>%
pull("title") # 제목에서 후쿠시마 찾기
last_24_hours %>%
filter(str_detect(title,"^후쿠시마")) %>%
pull("title") # 제목에서 후쿠시마로 시작하는...찾기
last_24_hours %>%
filter(str_detect(title,"^\"후쿠시마")) %>%
pull("title") # 제목에서 "후쿠시마로 시작하는...찾기 [후쿠시마 인용]
last_24_hours %>%
filter(str_detect(title,"^\'후쿠시마")) %>%
pull("title") # 제목에서 '후쿠시마로 시작하는...찾기 [후쿠시마 인용]
last_24_hours %>%
filter(str_detect(title,"^“후쿠시마")) %>%
pull("title") # 제목에서 “후쿠시마로 시작하는...찾기 [후쿠시마 인용]
last_24_hours %>%
filter(str_detect(title,"^‘후쿠시마")) %>%
pull("title") # 제목에서 ‘후쿠시마로 시작하는...찾기 [후쿠시마 인용]
library(purrr)
get_first_word <- function(x) {
str_split(x, "\\s")[[1]][1]
}
last_24_hours %>%
filter(str_detect(map_chr(title, get_first_word),"후쿠시마")) %>%
pull("title") # 제목의 첫 토큰에서 후쿠시마가 포함된 사례 찾기