
    NgXA              	          d dl mZmZmZ d dlZd dlZddlmZ dZdZ	dZ
dZd	Zd
                    ee	g          Zd
                    eeddde
eg          Zd
                    edg          Z ej        d          Z ej        d          Zd Zd Z edd          Zd Zd Zd Zd Z ej        d          Z ej        d          Z ej        d          Z G d de          Z dS )    )absolute_importdivisionunicode_literalsN   )DataLossWarninga^  
[#x0041-#x005A] | [#x0061-#x007A] | [#x00C0-#x00D6] | [#x00D8-#x00F6] |
[#x00F8-#x00FF] | [#x0100-#x0131] | [#x0134-#x013E] | [#x0141-#x0148] |
[#x014A-#x017E] | [#x0180-#x01C3] | [#x01CD-#x01F0] | [#x01F4-#x01F5] |
[#x01FA-#x0217] | [#x0250-#x02A8] | [#x02BB-#x02C1] | #x0386 |
[#x0388-#x038A] | #x038C | [#x038E-#x03A1] | [#x03A3-#x03CE] |
[#x03D0-#x03D6] | #x03DA | #x03DC | #x03DE | #x03E0 | [#x03E2-#x03F3] |
[#x0401-#x040C] | [#x040E-#x044F] | [#x0451-#x045C] | [#x045E-#x0481] |
[#x0490-#x04C4] | [#x04C7-#x04C8] | [#x04CB-#x04CC] | [#x04D0-#x04EB] |
[#x04EE-#x04F5] | [#x04F8-#x04F9] | [#x0531-#x0556] | #x0559 |
[#x0561-#x0586] | [#x05D0-#x05EA] | [#x05F0-#x05F2] | [#x0621-#x063A] |
[#x0641-#x064A] | [#x0671-#x06B7] | [#x06BA-#x06BE] | [#x06C0-#x06CE] |
[#x06D0-#x06D3] | #x06D5 | [#x06E5-#x06E6] | [#x0905-#x0939] | #x093D |
[#x0958-#x0961] | [#x0985-#x098C] | [#x098F-#x0990] | [#x0993-#x09A8] |
[#x09AA-#x09B0] | #x09B2 | [#x09B6-#x09B9] | [#x09DC-#x09DD] |
[#x09DF-#x09E1] | [#x09F0-#x09F1] | [#x0A05-#x0A0A] | [#x0A0F-#x0A10] |
[#x0A13-#x0A28] | [#x0A2A-#x0A30] | [#x0A32-#x0A33] | [#x0A35-#x0A36] |
[#x0A38-#x0A39] | [#x0A59-#x0A5C] | #x0A5E | [#x0A72-#x0A74] |
[#x0A85-#x0A8B] | #x0A8D | [#x0A8F-#x0A91] | [#x0A93-#x0AA8] |
[#x0AAA-#x0AB0] | [#x0AB2-#x0AB3] | [#x0AB5-#x0AB9] | #x0ABD | #x0AE0 |
[#x0B05-#x0B0C] | [#x0B0F-#x0B10] | [#x0B13-#x0B28] | [#x0B2A-#x0B30] |
[#x0B32-#x0B33] | [#x0B36-#x0B39] | #x0B3D | [#x0B5C-#x0B5D] |
[#x0B5F-#x0B61] | [#x0B85-#x0B8A] | [#x0B8E-#x0B90] | [#x0B92-#x0B95] |
[#x0B99-#x0B9A] | #x0B9C | [#x0B9E-#x0B9F] | [#x0BA3-#x0BA4] |
[#x0BA8-#x0BAA] | [#x0BAE-#x0BB5] | [#x0BB7-#x0BB9] | [#x0C05-#x0C0C] |
[#x0C0E-#x0C10] | [#x0C12-#x0C28] | [#x0C2A-#x0C33] | [#x0C35-#x0C39] |
[#x0C60-#x0C61] | [#x0C85-#x0C8C] | [#x0C8E-#x0C90] | [#x0C92-#x0CA8] |
[#x0CAA-#x0CB3] | [#x0CB5-#x0CB9] | #x0CDE | [#x0CE0-#x0CE1] |
[#x0D05-#x0D0C] | [#x0D0E-#x0D10] | [#x0D12-#x0D28] | [#x0D2A-#x0D39] |
[#x0D60-#x0D61] | [#x0E01-#x0E2E] | #x0E30 | [#x0E32-#x0E33] |
[#x0E40-#x0E45] | [#x0E81-#x0E82] | #x0E84 | [#x0E87-#x0E88] | #x0E8A |
#x0E8D | [#x0E94-#x0E97] | [#x0E99-#x0E9F] | [#x0EA1-#x0EA3] | #x0EA5 |
#x0EA7 | [#x0EAA-#x0EAB] | [#x0EAD-#x0EAE] | #x0EB0 | [#x0EB2-#x0EB3] |
#x0EBD | [#x0EC0-#x0EC4] | [#x0F40-#x0F47] | [#x0F49-#x0F69] |
[#x10A0-#x10C5] | [#x10D0-#x10F6] | #x1100 | [#x1102-#x1103] |
[#x1105-#x1107] | #x1109 | [#x110B-#x110C] | [#x110E-#x1112] | #x113C |
#x113E | #x1140 | #x114C | #x114E | #x1150 | [#x1154-#x1155] | #x1159 |
[#x115F-#x1161] | #x1163 | #x1165 | #x1167 | #x1169 | [#x116D-#x116E] |
[#x1172-#x1173] | #x1175 | #x119E | #x11A8 | #x11AB | [#x11AE-#x11AF] |
[#x11B7-#x11B8] | #x11BA | [#x11BC-#x11C2] | #x11EB | #x11F0 | #x11F9 |
[#x1E00-#x1E9B] | [#x1EA0-#x1EF9] | [#x1F00-#x1F15] | [#x1F18-#x1F1D] |
[#x1F20-#x1F45] | [#x1F48-#x1F4D] | [#x1F50-#x1F57] | #x1F59 | #x1F5B |
#x1F5D | [#x1F5F-#x1F7D] | [#x1F80-#x1FB4] | [#x1FB6-#x1FBC] | #x1FBE |
[#x1FC2-#x1FC4] | [#x1FC6-#x1FCC] | [#x1FD0-#x1FD3] | [#x1FD6-#x1FDB] |
[#x1FE0-#x1FEC] | [#x1FF2-#x1FF4] | [#x1FF6-#x1FFC] | #x2126 |
[#x212A-#x212B] | #x212E | [#x2180-#x2182] | [#x3041-#x3094] |
[#x30A1-#x30FA] | [#x3105-#x312C] | [#xAC00-#xD7A3]z*[#x4E00-#x9FA5] | #x3007 | [#x3021-#x3029]a  
[#x0300-#x0345] | [#x0360-#x0361] | [#x0483-#x0486] | [#x0591-#x05A1] |
[#x05A3-#x05B9] | [#x05BB-#x05BD] | #x05BF | [#x05C1-#x05C2] | #x05C4 |
[#x064B-#x0652] | #x0670 | [#x06D6-#x06DC] | [#x06DD-#x06DF] |
[#x06E0-#x06E4] | [#x06E7-#x06E8] | [#x06EA-#x06ED] | [#x0901-#x0903] |
#x093C | [#x093E-#x094C] | #x094D | [#x0951-#x0954] | [#x0962-#x0963] |
[#x0981-#x0983] | #x09BC | #x09BE | #x09BF | [#x09C0-#x09C4] |
[#x09C7-#x09C8] | [#x09CB-#x09CD] | #x09D7 | [#x09E2-#x09E3] | #x0A02 |
#x0A3C | #x0A3E | #x0A3F | [#x0A40-#x0A42] | [#x0A47-#x0A48] |
[#x0A4B-#x0A4D] | [#x0A70-#x0A71] | [#x0A81-#x0A83] | #x0ABC |
[#x0ABE-#x0AC5] | [#x0AC7-#x0AC9] | [#x0ACB-#x0ACD] | [#x0B01-#x0B03] |
#x0B3C | [#x0B3E-#x0B43] | [#x0B47-#x0B48] | [#x0B4B-#x0B4D] |
[#x0B56-#x0B57] | [#x0B82-#x0B83] | [#x0BBE-#x0BC2] | [#x0BC6-#x0BC8] |
[#x0BCA-#x0BCD] | #x0BD7 | [#x0C01-#x0C03] | [#x0C3E-#x0C44] |
[#x0C46-#x0C48] | [#x0C4A-#x0C4D] | [#x0C55-#x0C56] | [#x0C82-#x0C83] |
[#x0CBE-#x0CC4] | [#x0CC6-#x0CC8] | [#x0CCA-#x0CCD] | [#x0CD5-#x0CD6] |
[#x0D02-#x0D03] | [#x0D3E-#x0D43] | [#x0D46-#x0D48] | [#x0D4A-#x0D4D] |
#x0D57 | #x0E31 | [#x0E34-#x0E3A] | [#x0E47-#x0E4E] | #x0EB1 |
[#x0EB4-#x0EB9] | [#x0EBB-#x0EBC] | [#x0EC8-#x0ECD] | [#x0F18-#x0F19] |
#x0F35 | #x0F37 | #x0F39 | #x0F3E | #x0F3F | [#x0F71-#x0F84] |
[#x0F86-#x0F8B] | [#x0F90-#x0F95] | #x0F97 | [#x0F99-#x0FAD] |
[#x0FB1-#x0FB7] | #x0FB9 | [#x20D0-#x20DC] | #x20E1 | [#x302A-#x302F] |
#x3099 | #x309Aa  
[#x0030-#x0039] | [#x0660-#x0669] | [#x06F0-#x06F9] | [#x0966-#x096F] |
[#x09E6-#x09EF] | [#x0A66-#x0A6F] | [#x0AE6-#x0AEF] | [#x0B66-#x0B6F] |
[#x0BE7-#x0BEF] | [#x0C66-#x0C6F] | [#x0CE6-#x0CEF] | [#x0D66-#x0D6F] |
[#x0E50-#x0E59] | [#x0ED0-#x0ED9] | [#x0F20-#x0F29]z}
#x00B7 | #x02D0 | #x02D1 | #x0387 | #x0640 | #x0E46 | #x0EC6 | #x3005 |
#[#x3031-#x3035] | [#x309D-#x309E] | [#x30FC-#x30FE] | .-_z#x([\d|A-F]{4,4})z'\[#x([\d|A-F]{4,4})-#x([\d|A-F]{4,4})\]c                    d |                      d          D             }g }|D ]}d}t          t          fD ]u}|                    |          }|\|                    d |                                D                        t          |d                   dk    r|d         dz  |d<   d} nv|s;t          |          dk    sJ |                    t          |          gdz             t          |          }|S )	Nc                 6    g | ]}|                                 S  )strip.0items     N/var/www/html/ai-engine/env/lib/python3.11/site-packages/html5lib/_ihatexml.py
<listcomp>z$charStringToList.<locals>.<listcomp>h   s     >>>4$**,,>>>    r   Fc                 ,    g | ]}t          |          S r   )hexToIntr   s     r   r   z$charStringToList.<locals>.<listcomp>o   s    EEEd8D>>EEEr   r      T)	splitreCharreCharRangematchappendgroupslenordnormaliseCharList)chars
charRangesrvr   
foundMatchregexpr   s          r   charStringToListr(   g   s   >>5;;u+=+=>>>J	B ' '
{+ 	 	FLL&&E 		EEellnnEEEFFFr"v;;!##VaZBrF!
 !  	't99>>>>IIs4yykAo&&&	2		BIr   c                    t          |           } | D ]}|d         |d         k    sJ g }d}|t          |           k     rd}|                    | |                    ||z   t          |           k     r}| ||z            d         |d         d         dz   k    rY| ||z            d         |d         d<   |dz  }||z   t          |           k     r$| ||z            d         |d         d         dz   k    Y||z  }|t          |           k     |S )Nr   r   r   )sortedr    r   )charListr   r%   ijs        r   r"   r"   |   s*   hH " "Aw$q'!!!!!	B	A
c(mm


		(1+!ec(mm##Q(:bfQi!m(K(K Q*BrF1IFA !ec(mm##Q(:bfQi!m(K(K 	
Q c(mm

 Ir   FFFF   c                    g }| d         dk    r&|                     d| d         d         dz
  g           t          | d d                   D ]7\  }}|                     |d         dz   | |dz            d         dz
  g           8| d         d         t          k    r+|                     | d         d         dz   t          g           |S )Nr   r   r   )r   	enumeratemax_unicode)r+   r%   r,   r   s       r   missingRangesr3      s    	B{a
		1hqk!nq()***Xcrc]++ 9 94
		47Q;Q 2Q 678888|A+%%
		8B<?Q&4555Ir   c           
         g }| D ]}|d         |d         k    r6|                     t          t          |d                                        J|                     t          t          |d                             dz   t          t          |d                             z              dd                    |          z  S )Nr   r   r
   z[%s] )r   escapeRegexpchrjoin)r+   r%   r   s      r   listToRegexpStrr9      s    	B 2 27d1gIIl3tAw<<001111IIl3tAw<<0036"3tAw<<001 2 2 2 2BGGBKKr   c                 "    t          | d          S )Nr/   )int)hex_strs    r   r   r      s    wr   c                 F    d}|D ]}|                      |d|z             } | S )N)r	   ^$*+?{}[]|()r
   \)replace)stringspecialCharacterschars      r   r6   r6      s7    7! 3 3dTk22Mr   u  [ -,/:-@\[-\^`\{-¶¸-¿×÷Ĳ-ĳĿ-ŀŉſǄ-ǌǱ-ǳǶ-ǹȘ-ɏʩ-ʺ˂-ˏ˒-˿͆-͟͢-΅΋΍΢Ϗϗ-ϙϛϝϟϡϴ-ЀЍѐѝ҂҇-ҏӅ-ӆӉ-ӊӍ-ӏӬ-ӭӶ-ӷӺ-԰՗-՘՚-ՠև-֐ֺ֢־׀׃ׅ-׏׫-ׯ׳-ؠػ-ؿٓ-ٟ٪-ٯڸ-ڹڿۏ۔۩ۮ-ۯۺ-ऀऄऺ-ऻॎ-ॐॕ-ॗ।-॥॰-ঀ঄঍-঎঑-঒঩঱঳-঵঺-঻ঽ৅-৆৉-৊ৎ-৖৘-৛৞৤-৥৲-ਁਃ-਄਋-਎਑-਒਩਱਴਷਺-਻਽੃-੆੉-੊੎-੘੝੟-੥ੵ-઀઄ઌ઎઒઩઱઴઺-઻૆૊૎-૟ૡ-૥૰-଀଄଍-଎଑-଒଩଱଴-ଵ଺-଻ୄ-୆୉-୊୎-୕୘-୛୞ୢ-୥୰-஁஄஋-஍஑஖-஘஛஝஠-஢஥-஧஫-஭ஶ஺-஽௃-௅௉௎-௖௘-௦௰-ఀఄ఍఑఩ఴ఺-ఽ౅౉౎-౔౗-౟ౢ-౥౰-ಁ಄಍಑಩಴಺-ಽ೅೉೎-೔೗-ೝ೟ೢ-೥೰-ഁഄ഍഑ഩഺ-ഽൄ-൅൉ൎ-ൖ൘-ൟൢ-൥൰-฀ฯ฻-฿๏๚-຀຃຅-ຆຉ຋-ຌຎ-ຓຘຠ຤຦ຨ-ຩຬຯ຺຾-຿໅໇໎-໏໚-༗༚-༟༪-༴༶༸༺-༽཈ཪ-཰྅ྌ-ྏྖ྘ྮ-ྰྸྺ-႟჆-჏ჷ-ჿᄁᄄᄈᄊᄍᄓ-ᄻᄽᄿᅁ-ᅋᅍᅏᅑ-ᅓᅖ-ᅘᅚ-ᅞᅢᅤᅦᅨᅪ-ᅬᅯ-ᅱᅴᅶ-ᆝᆟ-ᆧᆩ-ᆪᆬ-ᆭᆰ-ᆶᆹᆻᇃ-ᇪᇬ-ᇯᇱ-ᇸᇺ-᷿ẜ-ẟỺ-ỿ἖-἗἞-἟὆-὇὎-὏὘὚὜὞὾-὿᾵᾽᾿-῁῅῍-῏῔-῕῜-῟῭-῱῵´-⃏⃝-⃠⃢-℥℧-℩ℬ-ℭℯ-ⅿↃ-〄〆〈-〠〰〶-぀ゕ-゘゛-゜ゟ-゠・ヿ-㄄ㄭ-䷿龦-꯿힤-￿]u  [ -@\[-\^`\{-¿×÷Ĳ-ĳĿ-ŀŉſǄ-ǌǱ-ǳǶ-ǹȘ-ɏʩ-ʺ˂-΅·΋΍΢Ϗϗ-ϙϛϝϟϡϴ-ЀЍѐѝ҂-ҏӅ-ӆӉ-ӊӍ-ӏӬ-ӭӶ-ӷӺ-԰՗-՘՚-ՠև-׏׫-ׯ׳-ؠػ-ـً-ٰڸ-ڹڿۏ۔ۖ-ۤۧ-ऄऺ-़ा-ॗॢ-঄঍-঎঑-঒঩঱঳-঵঺-৛৞ৢ-৯৲-਄਋-਎਑-਒਩਱਴਷਺-੘੝੟-ੱੵ-઄ઌ઎઒઩઱઴઺-઼ા-૟ૡ-଄଍-଎଑-଒଩଱଴-ଵ଺-଼ା-୛୞ୢ-஄஋-஍஑஖-஘஛஝஠-஢஥-஧஫-஭ஶ஺-ఄ఍఑఩ఴ఺-౟ౢ-಄಍಑಩಴಺-ೝ೟ೢ-ഄ഍഑ഩഺ-ൟൢ-฀ฯัิ-฿ๆ-຀຃຅-ຆຉ຋-ຌຎ-ຓຘຠ຤຦ຨ-ຩຬຯັິ-ຼ຾-຿໅-༿཈ཪ-႟჆-჏ჷ-ჿᄁᄄᄈᄊᄍᄓ-ᄻᄽᄿᅁ-ᅋᅍᅏᅑ-ᅓᅖ-ᅘᅚ-ᅞᅢᅤᅦᅨᅪ-ᅬᅯ-ᅱᅴᅶ-ᆝᆟ-ᆧᆩ-ᆪᆬ-ᆭᆰ-ᆶᆹᆻᇃ-ᇪᇬ-ᇯᇱ-ᇸᇺ-᷿ẜ-ẟỺ-ỿ἖-἗἞-἟὆-὇὎-὏὘὚὜὞὾-὿᾵᾽᾿-῁῅῍-῏῔-῕῜-῟῭-῱῵´-℥℧-℩ℬ-ℭℯ-ⅿↃ-〆〈-〠〪-぀ゕ-゠・-㄄ㄭ-䷿龦-꯿힤-￿]z#[^ 
a-zA-Z0-9\-'()+,./:=?;!*#@$_%]c                       e Zd Z ej        d          Z	 	 	 	 	 	 ddZddZd Zd Z	d	 Z
d
 Zd Zd Zd Zd Zd ZdS )InfosetFilterzU[\dA-F]{5,5}FTc                 h    || _         || _        || _        || _        || _        || _        i | _        d S N)dropXmlnsLocalNamedropXmlnsAttrNspreventDoubleDashCommentspreventDashAtCommentEndreplaceFormFeedCharacterspreventSingleQuotePubidreplaceCache)selfrS   rT   rU   rV   rW   rX   s          r   __init__zInfosetFilter.__init__   sB     #5.)B&'>$)B&'>$r   Nc                     | j         r1|                    d          rt          j        dt                     d S | j        r"|dk    rt          j        dt                     d S |                     |          S )Nzxmlns:z"Attributes cannot begin with xmlnszhttp://www.w3.org/2000/xmlns/z)Attributes cannot be in the xml namespace)rS   
startswithwarningswarnr   rT   	toXmlName)rZ   name	namespaces      r   coerceAttributezInfosetFilter.coerceAttribute   sy    " 	(tx'@'@ 	(M>PPP4" 	(:::MEWWW4>>$'''r   c                 ,    |                      |          S rR   )r`   )rZ   ra   s     r   coerceElementzInfosetFilter.coerceElement   s    ~~d###r   c                     | j         rld|v r4t          j        dt                     |                    dd          }d|v 4|                    d          rt          j        dt                     |dz  }|S )Nz--z'Comments cannot contain adjacent dashesz- -r
   zComments cannot end in a dash )rU   r^   r_   r   rK   endswith)rZ   datas     r   coerceCommentzInfosetFilter.coerceComment   s~    ) 	$,,GYYY||D%00 $,, }}S!! =OOOr   c                     | j         rUt          |                    d                    D ]}t          j        dt
                     |                    dd          }|S )NzText cannot contain U+000Crg   )rW   rangecountr^   r_   r   rK   )rZ   ri   r   s      r   coerceCharacterszInfosetFilter.coerceCharacters   s`    ) 	-4::f--.. M M:OLLLL<<,,Dr   c                    |}t                               |          D ]G}t          j        dt                     |                     |          }|                    ||          }H| j        r\|                    d          dk    rCt          j        dt                     |                    d|                     d                    }|S )NzCoercing non-XML pubid'r   z!Pubid cannot contain single quote)	nonPubidCharRegexpfindallr^   r_   r   getReplacementCharacterrK   rX   find)rZ   ri   
dataOutputrN   replacements        r   coercePubidzInfosetFilter.coercePubid   s    
&..t44 	? 	?DM2ODDD66t<<K#++D+>>JJ' 	TJOOC,@,@A,E,EM=OOO#++C1M1Mc1R1RSSJr   c                    |d         }|dd          }t                               |          }|r3t          j        d|z  t                     |                     |          }n|}|}t          t                              |                    }|D ]J}t          j        d|z  t                     |                     |          }	|	                    ||	          }K||z   S )Nr   r   zCoercing non-XML name: %s)
nonXmlNameFirstBMPRegexpr   r^   r_   r   rt   setnonXmlNameBMPRegexprs   rK   )
rZ   ra   	nameFirstnameRestmnameFirstOutputnameRestOutputreplaceCharsrN   rw   s
             r   r`   zInfosetFilter.toXmlName   s    G	8$**955 	(M5<oNNN"::9EEOO'O!.66x@@AA  	G 	GDM5<oNNN66t<<K+33D+FFNN//r   c                 ^    || j         v r| j         |         }n|                     |          }|S rR   )rY   
escapeCharrZ   rN   rw   s      r   rt   z%InfosetFilter.getReplacementCharacter  s6    4$$$+D1KK//$//Kr   c                     t          | j                            |                    D ]+}|                    ||                     |                    },|S rR   )r{   replacementRegexprs   rK   unescapeChar)rZ   ra   r   s      r   fromXmlNamezInfosetFilter.fromXmlName  sR    .66t<<== 	? 	?D<<d&7&7&=&=>>DDr   c                 >    dt          |          z  }|| j        |<   |S )NzU%05X)r!   rY   r   s      r   r   zInfosetFilter.escapeChar  s%    D		)"-$r   c                 L    t          t          |dd          d                    S )Nr   r/   )r7   r;   )rZ   charcodes     r   r   zInfosetFilter.unescapeChar   s"    3x|R(()))r   )FFFFTFrR   )__name__
__module____qualname__recompiler   r[   rc   re   rj   ro   rx   r`   rt   r   r   r   r   r   r   rP   rP      s        "
#344 %*!&+0).+/).   (	( 	( 	( 	($ $ $    	 	 	0 0 0$    
  
* * * * *r   rP   )!
__future__r   r   r   r   r^   	constantsr   baseCharideographiccombiningCharacterdigitextenderr8   letterra   r}   r   r   r   r(   r"   r;   r2   r3   r9   r   r6   r|   rz   rr   objectrP   r   r   r   <module>r      s   B B B B B B B B B B 				  & & & & & &.7` ? 0	78 
X{+	,	, zz65#sC1C  JJ}%%		(	)	)bjCDD  *  " c&"oo            !bj  "m,  n,  n, %2:  'W   X   X    RZ OPP f* f* f* f* f*F f* f* f* f* f*r   