Some HAT... |
| = Анабар.ru => Python-форумы => Язык программирования Python => сообщение 733 |
| | Вход | Регистрация | |
нет
фото
Автор: Dirk Diggler Дата: 5-Dec-2005 22:09 (gmt = -3.0) E-mail: vorlogo@rambler.ru Регэкспы и Юникод
надо обработать текст в юникоде регэкспами. Обгуглил весь инет - ничего внятного не нашел.Пишу вот такой простейший скрипт
1 2 import re 3 inp_file=open('xian2.txt') 4 cur_line=unicode(inp_file.read(),'utf-8') 5 rxFndSpAndSym=re.compile("\s\w",re.U) 6 found=rxFndSpAndSym.search(cur_line) 7 out_line=found.string.encode('utf-8') 8 out_file=open('xian3.txt','w') 9 out_file.write(out_line) 10 out_file.closeа он мне в выходной файл переписывает исходный без каких-либо изменений. Где я что-то не учëл? Как сделать так, чтобы метасимволы интерпретировались нормально?
все сообщения ветви:
- 733 Регэкспы и Юникод Dirk Diggler | 5-Dec-2005, 22:09 | просмотров: 4137 ⇐ ◄
- 739 А какая именно цель? Найти первое вхождение или все? Anabar | 9-Dec-2005, 13:31 | просмотров: 3943
- 741 Цель была заставить регэкспы заработать. 8-) (+) Dirk Diggler | 10-Dec-2005, 21:51 | просмотров: 3894
- 744 Что бы не было этой ошибки используйте utf-16 и заодно Anabar | 13-Dec-2005, 23:25 | просмотров: 4134
- 755 заработало, но не могу составить регэксп Dirk Diggler | 4-Jan-2006, 14:45 | просмотров: 4239
Недостаточно прав для написания ответа
Время генерации страницы в секундах: 0.086