라이브러리
[PHP] IntlBreakIterator::createWordInstance - 단어 구분을 위한 구분 반복자 생성
IntlBreakIterator::createWordInstance
`IntlBreakIterator::createWordInstance`는 PHP 7.2 버전부터 사용할 수 있는 함수입니다. 이 함수는 언어별로 단어를 구분하는 BreakIterator를 생성하는 데 사용됩니다.
BreakIterator는 텍스트를 단어, 문장, 구절 등으로 구분하는 데 사용되는 인터페이스입니다. 이 인터페이스는 텍스트를 분석하여 언어별로 단어를 구분하는 데 사용됩니다.
사용 예제
아래 예제는 한글로 된 텍스트를 분석하여 단어를 구분하는 예제입니다.
#hostingforum.kr
php
use IntlBreakIterator;
$text = '안녕하세요. 저는 PHP 개발자입니다.';
$breakIterator = IntlBreakIterator::createWordInstance('ko_KR');
$breakIterator->setText($text);
$words = array();
for ($i = $breakIterator->first(); $i !== IntlBreakIterator::DONE; $i = $breakIterator->next()) {
$words[] = $breakIterator->getPreceding($i);
}
print_r($words);
이 예제에서는 `ko_KR` 언어의 BreakIterator를 생성하여 한글로 된 텍스트를 분석합니다. 분석된 단어는 `$words` 배열에 저장되어 출력됩니다.
결과
#hostingforum.kr
php
Array
(
[0] => 안녕하세요
[1] =>
[2] => 저는
[3] => PHP
[4] => 개발자입니다
)
이 예제에서 `저는`과 `개발자입니다`는 한글로 된 단어이지만, BreakIterator는 이를 두 개의 단어로 구분합니다. 이는 언어별로 단어를 구분하는 데 사용되는 규칙에 따라 달라질 수 있습니다.
언어별 BreakIterator
IntlBreakIterator::createWordInstance 함수는 언어별로 BreakIterator를 생성할 수 있습니다. 예를 들어, 영어의 BreakIterator를 생성하려면 `'en_US'`을 사용할 수 있습니다.
#hostingforum.kr
php
$breakIterator = IntlBreakIterator::createWordInstance('en_US');
참고
* IntlBreakIterator::createWordInstance 함수는 PHP 7.2 버전부터 사용할 수 있습니다.
* 언어별 BreakIterator를 생성하려면 언어 코드를 사용합니다. 예를 들어, 한글은 `'ko_KR'`, 영어는 `'en_US'`를 사용합니다.
* BreakIterator는 텍스트를 분석하여 언어별로 단어를 구분하는 데 사용됩니다.
-
- 나우호스팅 @pcs8404
-
호스팅포럼 화이팅!
댓글목록
등록된 댓글이 없습니다.