잠 못 드는 개발자
close
프로필 배경
프로필 로고

잠 못 드는 개발자

  • 분류 전체보기 (152)
    • Front-end (45)
      • HTML (25)
      • CSS (6)
      • JavaScript (7)
      • React (7)
    • Back-end (21)
      • SQL (2)
      • JAVA (13)
      • Spring (2)
      • Flask (4)
    • AI (64)
      • Python (32)
      • 모두의 딥러닝 (24)
      • NLP (7)
    • Android (5)
    • Git & Github (7)
    • IT 지식 (3)
    • Lecture (8)
  • 홈
  • 태그
  • 방명록
  • 글쓰기

[모두의 딥러닝] 22. 텍스트 전처리 - 토큰화(tokenization), 빈도 수 세기

자연어 처리(Natural Language Processing, NLP) - 인간의 언어를 컴퓨터가 이해하고 처리할 수 있는 형태로 변환하는 기술 - 딥러닝을 하기 전 텍스트를 정제하는 텍스트 전처리 과정 필요 텍스트 토큰화(tokenization) - 토큰(token) : 텍스트 데이터를 작은 단위로 분할하는 과정에서 생성된 단어, 음절, 형태소와 같은 개별적인 단위 - 토큰화(tokenization) : 입력된 텍스트를 잘게 나누는 과정 text_to_word_sequence : 텍스트를 단어 단위로 나눔 : keras에 존재 # 케라스의 텍스트 전처리와 관련한 함수중 text_to_word_sequence 함수를 불러옴 from tensorflow.keras.preprocessing.text imp..

  • format_list_bulleted AI/모두의 딥러닝
  • · 2023. 6. 2.
  • textsms
  • navigate_before
  • 1
  • navigate_next
공지사항
전체 카테고리
  • 분류 전체보기 (152)
    • Front-end (45)
      • HTML (25)
      • CSS (6)
      • JavaScript (7)
      • React (7)
    • Back-end (21)
      • SQL (2)
      • JAVA (13)
      • Spring (2)
      • Flask (4)
    • AI (64)
      • Python (32)
      • 모두의 딥러닝 (24)
      • NLP (7)
    • Android (5)
    • Git & Github (7)
    • IT 지식 (3)
    • Lecture (8)
최근 글
인기 글
최근 댓글
태그
  • #문법
  • #모두의 딥러닝
  • #HTML
  • #PYTHON
  • #두근두근파이썬
  • #딥러닝
  • #속성
  • #파이썬
  • #태그
  • #인공지능
전체 방문자
오늘
어제
전체
Copyright © 쭈미로운 생활 All rights reserved.
Designed by JJuum

티스토리툴바