라이브러리

[PHP] IntlBreakIterator::createWordInstance - 단어 구분을 위한 구분 반복자 생성




IntlBreakIterator::createWordInstance


`IntlBreakIterator::createWordInstance`는 PHP 7.2 버전부터 사용할 수 있는 함수입니다. 이 함수는 언어별로 단어를 구분하는 BreakIterator를 생성하는 데 사용됩니다.

BreakIterator는 텍스트를 단어, 문장, 구절 등으로 구분하는 데 사용되는 인터페이스입니다. 이 인터페이스는 텍스트를 분석하여 언어별로 단어를 구분하는 데 사용됩니다.

사용 예제


아래 예제는 한글로 된 텍스트를 분석하여 단어를 구분하는 예제입니다.

#hostingforum.kr
php

use IntlBreakIterator;



$text = '안녕하세요. 저는 PHP 개발자입니다.';



$breakIterator = IntlBreakIterator::createWordInstance('ko_KR');

$breakIterator->setText($text);



$words = array();

for ($i = $breakIterator->first(); $i !== IntlBreakIterator::DONE; $i = $breakIterator->next()) {

    $words[] = $breakIterator->getPreceding($i);

}



print_r($words);



이 예제에서는 `ko_KR` 언어의 BreakIterator를 생성하여 한글로 된 텍스트를 분석합니다. 분석된 단어는 `$words` 배열에 저장되어 출력됩니다.

결과


#hostingforum.kr
php

Array

(

    [0] => 안녕하세요

    [1] => 

    [2] => 저는

    [3] => PHP

    [4] => 개발자입니다

)



이 예제에서 `저는`과 `개발자입니다`는 한글로 된 단어이지만, BreakIterator는 이를 두 개의 단어로 구분합니다. 이는 언어별로 단어를 구분하는 데 사용되는 규칙에 따라 달라질 수 있습니다.

언어별 BreakIterator


IntlBreakIterator::createWordInstance 함수는 언어별로 BreakIterator를 생성할 수 있습니다. 예를 들어, 영어의 BreakIterator를 생성하려면 `'en_US'`을 사용할 수 있습니다.

#hostingforum.kr
php

$breakIterator = IntlBreakIterator::createWordInstance('en_US');



참고


* IntlBreakIterator::createWordInstance 함수는 PHP 7.2 버전부터 사용할 수 있습니다.
* 언어별 BreakIterator를 생성하려면 언어 코드를 사용합니다. 예를 들어, 한글은 `'ko_KR'`, 영어는 `'en_US'`를 사용합니다.
* BreakIterator는 텍스트를 분석하여 언어별로 단어를 구분하는 데 사용됩니다.
  • profile_image
    나우호스팅 @pcs8404 

    호스팅포럼 화이팅!

    댓글목록

    등록된 댓글이 없습니다.

  • 전체 10,077건 / 451 페이지

검색

게시물 검색