Location: PHPKode > scripts > Scuttle > scronide-scuttle-9ce0bb5/includes/utf8/tests/cases/utf8_bad.test.php
<?php
/**
* @version $Id: utf8_bad.test.php,v 1.6 2006/02/26 13:39:37 harryf Exp $
* @package utf8
* @subpackage Tests
*/

//--------------------------------------------------------------------
/**
* Includes
* @package utf8
* @subpackage Tests
*/
require_once(dirname(__FILE__).'/../config.php');
require_once UTF8 . '/utils/bad.php';

//--------------------------------------------------------------------
/**
* @package utf8
* @subpackage Tests
*/
class test_utf8_bad_find extends UnitTestCase {

    function test_utf8_bad_find() {
        $this->UnitTestCase('utf8_bad_find()');
    }
    
    function testValidUtf8() {
        $str = 'Iñtërnâtiônàlizætiøn';
        $this->assertFalse(utf8_bad_find($str));
    }
    
    function testValidUtf8Ascii() {
        $str = 'testing';
        $this->assertFalse(utf8_bad_find($str));
    }
    
    function testInvalidUtf8() {
        $str = "Iñtërnâtiôn\xe9àlizætiøn";
        $this->assertEqual(utf8_bad_find($str),15);
    }
    
    function testInvalidUtf8Ascii() {
        $str = "this is an invalid char '\xe9' here";
        $this->assertEqual(utf8_bad_find($str),25);
    }
    
    function testInvalidUtf8Start() {
        $str = "\xe9Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),0);
    }
    
    function testInvalidUtf8End() {
        $str = "Iñtërnâtiônàlizætiøn\xe9";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    
    function testValidTwoOctetId() {
        $str = "abc\xc3\xb1";
        $this->assertFalse(utf8_bad_find($str));
    }
    
    function testInvalidTwoOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn \xc3\x28 Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),28);
    }
    
    function testInvalidIdBetweenTwoAndThree() {
        $str = "Iñtërnâtiônàlizætiøn\xa0\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    
    
    function testValidThreeOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\xa1Iñtërnâtiônàlizætiøn";
        $this->assertFalse(utf8_bad_find($str));
    }
    
    
    function testInvalidThreeOctetSequenceSecond() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x28\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    
    function testInvalidThreeOctetSequenceThird() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\x28Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    
    function testValidFourOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x90\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertFalse(utf8_bad_find($str));
    }
    
    function testInvalidFourOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x28\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    
    function testInvalidFiveOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf8\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    
    function testInvalidSixOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xfc\xa1\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    

}

//--------------------------------------------------------------------
/**
* @package utf8
* @subpackage Tests
*/
class test_utf8_bad_findall extends UnitTestCase {

    function test_utf8_bad_findall() {
        $this->UnitTestCase('test_utf8_bad_findall()');
    }
    
    function testValidUtf8() {
        $str = 'Iñtërnâtiônàlizætiøn';
        $this->assertFalse(utf8_bad_findall($str));
    }
    
    function testValidUtf8Ascii() {
        $str = 'testing';
        $this->assertFalse(utf8_bad_findall($str));
    }
    
    function testInvalidUtf8() {
        $str = "Iñtërnâtiôn\xe9àlizætiøn";
        $test = array(15);
        $this->assertEqual(utf8_bad_findall($str),$test);
    }
    
    function testInvalidUtf8Ascii() {
        $str = "this is an invalid char '\xe9' here";
        $test = array(25);
        $this->assertEqual(utf8_bad_findall($str),$test);
    }
    
    function testInvalidUtf8Multiple() {
        $str = "\xe9Iñtërnâtiôn\xe9àlizætiøn\xe9";
        $test = array(0,16,29);
        $this->assertEqual(utf8_bad_findall($str),$test);
    }
    
    function testValidTwoOctetId() {
        $str = "abc\xc3\xb1";
        $this->assertFalse(utf8_bad_findall($str));
    }
    
    function testInvalidTwoOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn \xc3\x28 Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_findall($str),array(28));
    }
    
    function testInvalidIdBetweenTwoAndThree() {
        $str = "Iñtërnâtiônàlizætiøn\xa0\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_findall($str),array(27,28));
    }
    
    function testValidThreeOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\xa1Iñtërnâtiônàlizætiøn";
        $this->assertFalse(utf8_bad_findall($str));
    }
    
    function testInvalidThreeOctetSequenceSecond() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x28\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_findall($str),array(27,29));
    }
    
    function testInvalidThreeOctetSequenceThird() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\x28Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_find($str),27);
    }
    
    function testValidFourOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x90\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertFalse(utf8_bad_findall($str));
    }
    
    function testInvalidFourOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x28\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_findall($str),array(27,29,30));
    }
    
    function testInvalidFiveOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf8\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_findall($str),range(27,31));
    }
    
    function testInvalidSixOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xfc\xa1\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_findall($str),range(27,32));
    }
    

}

//--------------------------------------------------------------------
/**
* @package utf8
* @subpackage Tests
*/
class test_utf8_bad_strip extends UnitTestCase {

    function test_utf8_bad_strip() {
        $this->UnitTestCase('test_utf8_bad_strip()');
    }
    
    function testValidUtf8() {
        $str = 'Iñtërnâtiônàlizætiøn';
        $this->assertEqual(utf8_bad_strip($str),$str);
    }
    
    function testValidUtf8Ascii() {
        $str = 'testing';
        $this->assertEqual(utf8_bad_strip($str),$str);
    }
    
    function testInvalidUtf8() {
        $str = "Iñtërnâtiôn\xe9àlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),'Iñtërnâtiônàlizætiøn');
    }
    
    function testInvalidUtf8Ascii() {
        $str = "this is an invalid char '\xe9' here";
        $this->assertEqual(utf8_bad_strip($str),"this is an invalid char '' here");
    }
    
    function testInvalidUtf8Multiple() {
        $str = "\xe9Iñtërnâtiôn\xe9àlizætiøn\xe9";
        $this->assertEqual(utf8_bad_strip($str),'Iñtërnâtiônàlizætiøn');
    }
    
    function testValidTwoOctetId() {
        $str = "abc\xc3\xb1";
        $this->assertEqual(utf8_bad_strip($str),$str);
    }
    
    function testInvalidTwoOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn \xc3\x28 Iñtërnâtiônàlizætiøn";
        $stripped = "Iñtërnâtiônàlizætiøn \x28 Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$stripped);
    }
    
    function testInvalidIdBetweenTwoAndThree() {
        $str = "Iñtërnâtiônàlizætiøn\xa0\xa1Iñtërnâtiônàlizætiøn";
        $stripped = "IñtërnâtiônàlizætiønIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$stripped);
    }
    
    function testValidThreeOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$str);
    }
    
    function testInvalidThreeOctetSequenceSecond() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x28\xa1Iñtërnâtiônàlizætiøn";
        $stripped = "Iñtërnâtiônàlizætiøn(Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$stripped);
    }
    
    function testInvalidThreeOctetSequenceThird() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\x28Iñtërnâtiônàlizætiøn";
        $stripped = "Iñtërnâtiônàlizætiøn(Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$stripped);
    }
    
    function testValidFourOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x90\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$str);
    }
    
    function testInvalidFourOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x28\x8c\xbcIñtërnâtiônàlizætiøn";
        $stripped = "Iñtërnâtiônàlizætiøn(Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$stripped);
    }
    
    function testInvalidFiveOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf8\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $stripped = "IñtërnâtiônàlizætiønIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$stripped);
    }
    
    function testInvalidSixOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xfc\xa1\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $stripped = "IñtërnâtiônàlizætiønIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_strip($str),$stripped);
    }

}

//--------------------------------------------------------------------
/**
* @package utf8
* @subpackage Tests
*/
class test_utf8_bad_replace extends UnitTestCase {

    function test_utf8_bad_replace() {
        $this->UnitTestCase('test_utf8_bad_replace()');
    }
    
    function testValidUtf8() {
        $str = 'Iñtërnâtiônàlizætiøn';
        $this->assertEqual(utf8_bad_replace($str),$str);
    }
    
    function testValidUtf8Ascii() {
        $str = 'testing';
        $this->assertEqual(utf8_bad_replace($str),$str);
    }
    
    function testInvalidUtf8() {
        $str = "Iñtërnâtiôn\xe9àlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),'Iñtërnâtiôn?àlizætiøn');
    }
    
    function testInvalidUtf8WithX() {
        $str = "Iñtërnâtiôn\xe9àlizætiøn";
        $this->assertEqual(utf8_bad_replace($str,'X'),'IñtërnâtiônXàlizætiøn');
    }
    
    function testInvalidUtf8Ascii() {
        $str = "this is an invalid char '\xe9' here";
        $this->assertEqual(utf8_bad_replace($str),"this is an invalid char '?' here");
    }
    
    function testInvalidUtf8Multiple() {
        $str = "\xe9Iñtërnâtiôn\xe9àlizætiøn\xe9";
        $this->assertEqual(utf8_bad_replace($str),'?Iñtërnâtiôn?àlizætiøn?');
    }
    
    function testValidTwoOctetId() {
        $str = "abc\xc3\xb1";
        $this->assertEqual(utf8_bad_replace($str),$str);
    }
    
    function testInvalidTwoOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn \xc3\x28 Iñtërnâtiônàlizætiøn";
        $replaced= "Iñtërnâtiônàlizætiøn ?( Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$replaced);
    }
    
    function testInvalidIdBetweenTwoAndThree() {
        $str = "Iñtërnâtiônàlizætiøn\xa0\xa1Iñtërnâtiônàlizætiøn";
        $replaced= "Iñtërnâtiônàlizætiøn??Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$replaced);
    }
    
    function testValidThreeOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$str);
    }
    
    function testInvalidThreeOctetSequenceSecond() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x28\xa1Iñtërnâtiônàlizætiøn";
        $replaced= "Iñtërnâtiônàlizætiøn?(?Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$replaced);
    }
    
    function testInvalidThreeOctetSequenceThird() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\x28Iñtërnâtiônàlizætiøn";
        $replaced= "Iñtërnâtiônàlizætiøn??(Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$replaced);
    }
    
    function testValidFourOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x90\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$str);
    }
    
    function testInvalidFourOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x28\x8c\xbcIñtërnâtiônàlizætiøn";
        $replaced= "Iñtërnâtiônàlizætiøn?(??Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$replaced);
    }
    
    function testInvalidFiveOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf8\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $replaced= "Iñtërnâtiônàlizætiøn?????Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$replaced);
    }
    
    function testInvalidSixOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xfc\xa1\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $replaced= "Iñtërnâtiônàlizætiøn??????Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_replace($str),$replaced);
    }

}

//--------------------------------------------------------------------
/**
* @package utf8
* @subpackage Tests
*/
class test_utf8_bad_identify extends UnitTestCase {

    function test_utf8_bad_identify() {
        $this->UnitTestCase('utf8_bad_identify()');
    }
    
    function testValidUtf8() {
        $str = 'Iñtërnâtiônàlizætiøn';
        $this->assertFalse(utf8_bad_identify($str,$i));
        $this->assertNull($i);
    }
    
    function testValidUtf8Ascii() {
        $str = 'testing';
        $this->assertFalse(utf8_bad_identify($str,$i));
        $this->assertNull($i);
    }
    
    function testInvalidUtf8() {
        $str = "Iñtërnâtiôn\xe9àlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,15);
    }
    
    function testInvalidUtf8Ascii() {
        $str = "this is an invalid char '\xe9' here";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,25);
    }
    
    function testInvalidUtf8Start() {
        $str = "\xe9Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,0);
    }
    
    function testInvalidUtf8End() {
        $str = "Iñtërnâtiônàlizætiøn\xe9";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,27);
    }
    
    function testValidTwoOctetId() {
        $str = "abc\xc3\xb1";
        $this->assertFalse(utf8_bad_identify($str,$i));
        $this->assertNull($i);
    }
    
    function testInvalidTwoOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn \xc3\x28 Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,28);
    }
    
    function testInvalidIdBetweenTwoAndThree() {
        $str = "Iñtërnâtiônàlizætiøn\xa0\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQID);
        $this->assertEqual($i,27);
    }
    
    
    function testValidThreeOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\xa1Iñtërnâtiônàlizætiøn";
        $this->assertFalse(utf8_bad_identify($str,$i));
        $this->assertNull($i);
    }
    
    
    function testInvalidThreeOctetSequenceSecond() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x28\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,27);
    }
    
    function testInvalidThreeOctetSequenceThird() {
        $str = "Iñtërnâtiônàlizætiøn\xe2\x82\x28Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,28);
    }
    
    function testValidFourOctetId() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x90\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertFalse(utf8_bad_identify($str,$i));
        $this->assertNull($i);
    }
    
    function testInvalidFourOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf0\x28\x8c\xbcIñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_SEQINCOMPLETE);
        $this->assertEqual($i,27);
    }
    
    function testInvalidFiveOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xf8\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_5OCTET);
        $this->assertEqual($i,27);
    }
    
    function testInvalidSixOctetSequence() {
        $str = "Iñtërnâtiônàlizætiøn\xfc\xa1\xa1\xa1\xa1\xa1Iñtërnâtiônàlizætiøn";
        $this->assertEqual(utf8_bad_identify($str,$i),UTF8_BAD_6OCTET);
        $this->assertEqual($i,27);
    }
    

}

//--------------------------------------------------------------------
/**
* @package utf8
* @subpackage Tests
*/
if (!defined('TEST_RUNNING')) {
    define('TEST_RUNNING', true);
    $test = &new GroupTest('utf8_bad');
    $test->addTestCase(new test_utf8_bad_find());
    $test->addTestCase(new test_utf8_bad_findall());
    $test->addTestCase(new test_utf8_bad_strip());
    $test->addTestCase(new test_utf8_bad_replace());
    $test->addTestCase(new test_utf8_bad_identify());
    $reporter = & getTestReporter();
    $test->run($reporter);
}
Return current item: Scuttle