• unnest_tokens () 함수

    unnest_tokens () 함수는 R 프로그래밍 언어의 tidytext 패키지에 포함되어 있는 함수로, 텍스트 데이터를 토큰 단위로 분리합니다. 이 함수는 ‘tidy data’ 형식에 적합하게 텍스트를 처리하므로, 텍스트 마이닝 및 자연어 처리에 유용합니다. 이 함수는 각 토큰을 새로운 행으로 만들며, 텍스트가 포함된 열 외의 다른 열은 그대로 유지됩니다. 1. unnest_tokens() 개념 unnest_tokens() 함수는 R의 tidytext 패키지에 포함되어 있으며,…

  • Tibble 이해와 as_tibble() 함수

    1. Tibble 이란? Tibble 은 R에서 데이터를 다루기 위한 데이터 구조 중 하나로 R의 데이터 프레임(data.frame)을 좀 더 유용하게 확장한 것으로 보면 됩니다. Tibble 은 tidyverse 패키지의 일부로 제공되며, 데이터 프레임과 호환성이 있습니다. Tibble은 데이터 출력이 보기 좋고, 부분적으로 큰 데이터를 처리할 때 유용하며, 변수 유형이나 변수 이름을 다룰 때 더 간편합니다. 1) 주요 특징…

  • 불필요한 공백 제거 str_squish 함수

    불필요한 공백 제거를 위해서는 str_squish 함수를 사용합니다. str_squish 함수는 R 프로그래밍 언어의 stringr 패키지에 포함되어 있으며, 문자열에서 앞뒤 및 중간의 공백을 제거하는 기능을 수행합니다. 불필요한 공백 제거를 위해서 str_squish 함수의 개념과 주요 사용법에 대해 알아보겠습니다. 1. str_squish의 개념 str_squish()는 대상 문자열의 시작과 끝에 있는 불필요한 공백을 제거하고, 문자열 내부에 연속된 공백은 하나의 공백으로 줄입니다. 예를…

  • 텍스트 교체 str_replace, str_replace_all 함수

    텍스트 교체(str_replace, str_replace_all) 함수는 문자열 처리에 있어서 매우 유용한 도구입니다. 텍스트 교체 함수는 stringr 패키지에 포함되어 있으며, 특정 문자열을 다른 문자열로 치환하는 작업을 수행합니다. 1. 텍스트 교체(str_replace, str_replace_all) 함수의 개념 1) str_replace() str_replace() 함수는 문자열 내에서 첫 번째로 나타나는 특정 패턴을 다른 문자열로 치환합니다. 위 예시에서 “apple”이 첫 번째로 등장할 때만 “banana”로 치환되었습니다. 2) str_replace_all()…

  • 파이프 연산자 %>%의 중요성과 활용법

    R에서 파이프 연산자(%>%)를 통해 R 프로그래밍 코드의 가독성과 효율성을두 가지 요소를 동시에 증가시킬 수 있습니다. 본 글에서는 이러한 파이프 연산자가 무엇인지, 왜 필요한지, 그리고 어떻게 활용할 수 있는지에 대해 상세하게 알아보도록 하겠습니다. 1. 파이프 연산자 %>%란 무엇인가? %>% 연산자, 즉 파이프 연산자는 주로 dplyr나 tidyverse 패키지에서 사용됩니다. 이 연산자의 주 목적은 데이터나 결과를 다음 함수로…

  • Nginx + Php8 설정

    1. Nginx와 PHP 8 연결 nginx php8 패키지를 설치했다고 웹서버에서 php파일이 적용되는 것은 아닙니다. nginx가 php8를 서비스할 수 있도록 일부 파일의 수정이 필요합니다. 설정이 올바르지 않다면 nginx에서 php8이 제대로 작동하지 않습니다. 특히 php파일이 다운로드 되거나 phpinfo 또는 php 코드를 실행시 아무것도 나타나지 않는 문제가 생깁니다. 지금 확인하는 부분은 nginx와 php8 설정을 통해서 웹서버에서 php가 정상적으로…