Șiruri Python (cu exemple)

În acest tutorial veți învăța să creați, să formatați, să modificați și să ștergeți șiruri în Python. De asemenea, vi se vor prezenta diverse operații și funcții de șir.

Video: Python Strings

Ce este șirul în Python?

Un șir este o secvență de caractere.

Un personaj este pur și simplu un simbol. De exemplu, limba engleză are 26 de caractere.

Calculatoarele nu se ocupă de caractere, ci de numere (binare). Chiar dacă este posibil să vedeți caractere pe ecran, în interior este stocat și manipulat ca o combinație de 0 și 1.

Această conversie a caracterului într-un număr se numește codificare, iar procesul invers este decodarea. ASCII și Unicode sunt unele dintre codificările populare utilizate.

În Python, un șir este o secvență de caractere Unicode. Unicode a fost introdus pentru a include fiecare caracter în toate limbile și pentru a aduce uniformitate în codificare. Puteți afla despre Unicode din Python Unicode.

Cum se creează un șir în Python?

Șirurile pot fi create prin încadrarea caracterelor într-un ghilimel simplu sau ghilimele duble. Chiar și ghilimelele triple pot fi folosite în Python, dar în general folosite pentru a reprezenta șiruri de caractere și linii de documente.

 # defining strings in Python # all of the following are equivalent my_string = 'Hello' print(my_string) my_string = "Hello" print(my_string) my_string = '''Hello''' print(my_string) # triple quotes string can extend multiple lines my_string = """Hello, welcome to the world of Python""" print(my_string)

Când rulați programul, ieșirea va fi:

 Bună ziua Bună ziua Bună ziua, bine ați venit în lumea Python

Cum se accesează caracterele dintr-un șir?

Putem accesa caractere individuale folosind indexarea și o gamă de caractere folosind felierea. Indexul începe de la 0. Încercarea de a accesa un caracter în afara domeniului index va crește un IndexError. Indicele trebuie să fie un număr întreg. Nu putem folosi flotante sau alte tipuri, acest lucru va avea ca rezultat TypeError.

Python permite indexarea negativă pentru secvențele sale.

Indicele lui -1se referă la ultimul articol, -2la al doilea ultim articol și așa mai departe. Putem accesa o serie de articole dintr-un șir folosind operatorul de tranșare :(colon).

 #Accessing string characters in Python str = 'programiz' print('str = ', str) #first character print('str(0) = ', str(0)) #last character print('str(-1) = ', str(-1)) #slicing 2nd to 5th character print('str(1:5) = ', str(1:5)) #slicing 6th to 2nd last character print('str(5:-2) = ', str(5:-2))

Când rulăm programul de mai sus, obținem următoarea ieșire:

 str = programiz str (0) = p str (-1) = z str (1: 5) = rogr str (5: -2) = am

Dacă încercăm să accesăm un index în afara intervalului sau să folosim alte numere decât un număr întreg, vom primi erori.

 # index must be in range >>> my_string(15)… IndexError: string index out of range # index must be an integer >>> my_string(1.5)… TypeError: string indices must be integers

Felierea poate fi vizualizată cel mai bine luând în considerare indexul între elementele prezentate mai jos.

Dacă vrem să accesăm un interval, avem nevoie de indexul care va tăia porțiunea din șir.

Slicing String în Python

Cum se schimbă sau se șterge un șir?

Corzile sunt imuabile. Aceasta înseamnă că elementele unui șir nu pot fi modificate odată ce au fost atribuite. Putem pur și simplu reatribui șiruri diferite la același nume.

 >>> my_string = 'programiz' >>> my_string(5) = 'a'… TypeError: 'str' object does not support item assignment >>> my_string = 'Python' >>> my_string 'Python'

Nu putem șterge sau elimina caractere dintr-un șir. Dar ștergerea completă a șirului este posibilă folosind delcuvântul cheie.

 >>> del my_string(1)… TypeError: 'str' object doesn't support item deletion >>> del my_string >>> my_string… NameError: name 'my_string' is not defined

Operații de șir Python

Există multe operații care pot fi efectuate cu șiruri, ceea ce îl face unul dintre cele mai utilizate tipuri de date în Python.

Pentru a afla mai multe despre tipurile de date disponibile în Python, accesați: Tipuri de date Python

Concatenarea a două sau mai multe șiruri

Îmbinarea a două sau mai multe șiruri într-o singură se numește concatenare.

+ Operatorul face acest lucru în Python. Scrierea simplă a două litere șiruri împreună le concatenează.

* Operatorul poate fi folosit pentru a repeta șirul pentru un anumit număr de ori.

 # Python String Operations str1 = 'Hello' str2 ='World!' # using + print('str1 + str2 = ', str1 + str2) # using * print('str1 * 3 =', str1 * 3)

Când rulăm programul de mai sus, obținem următoarea ieșire:

str1 + str2 = HelloWorld! str1 * 3 = HelloHelloHello

Scrierea a două litere de caractere împreună le concatenează, de asemenea, ca operatorul + .

Dacă vrem să concatenăm șiruri în linii diferite, putem folosi paranteze.

 >>> # two string literals together >>> 'Hello ''World!' 'Hello World!' >>> # using parentheses >>> s = ('Hello '… 'World') >>> s 'Hello World'

Iterând printr-un șir

Putem itera printr-un șir folosind o buclă for. Iată un exemplu pentru a număra numărul 'într-un șir.

 # Iterating through a string count = 0 for letter in 'Hello World': if(letter == 'l'): count += 1 print(count,'letters found')

Când rulăm programul de mai sus, obținem următoarea ieșire:

 3 litere găsite

Test de membru al șirului

We can test if a substring exists within a string or not, using the keyword in.

 >>> 'a' in 'program' True >>> 'at' not in 'battle' False

Built-in functions to Work with Python

Various built-in functions that work with sequence work with strings as well.

Some of the commonly used ones are enumerate() and len(). The enumerate() function returns an enumerate object. It contains the index and value of all the items in the string as pairs. This can be useful for iteration.

Similarly, len() returns the length (number of characters) of the string.

 str = 'cold' # enumerate() list_enumerate = list(enumerate(str)) print('list(enumerate(str) = ', list_enumerate) #character count print('len(str) = ', len(str))

When we run the above program, we get the following output:

 list(enumerate(str) = ((0, 'c'), (1, 'o'), (2, 'l'), (3, 'd')) len(str) = 4

Python String Formatting

Escape Sequence

If we want to print a text like He said, "What's there?", we can neither use single quotes nor double quotes. This will result in a SyntaxError as the text itself contains both single and double quotes.

 >>> print("He said, "What's there?"")… SyntaxError: invalid syntax >>> print('He said, "What's there?"')… SyntaxError: invalid syntax

One way to get around this problem is to use triple quotes. Alternatively, we can use escape sequences.

An escape sequence starts with a backslash and is interpreted differently. If we use a single quote to represent a string, all the single quotes inside the string must be escaped. Similar is the case with double quotes. Here is how it can be done to represent the above text.

 # using triple quotes print('''He said, "What's there?"''') # escaping single quotes print('He said, "What\'s there?"') # escaping double quotes print("He said, "What's there? "")

When we run the above program, we get the following output:

 He said, "What's there?" He said, "What's there?" He said, "What's there?"

Here is a list of all the escape sequences supported by Python.

Escape Sequence Description
ewline Backslash and newline ignored
\ Backslash
\' Single quote
" Double quote
a ASCII Bell
 ASCII Backspace
f ASCII Formfeed
ASCII Linefeed
ASCII Carriage Return
ASCII Horizontal Tab
v ASCII Vertical Tab
ooo Character with octal value ooo
xHH Character with hexadecimal value HH

Here are some examples

 >>> print("C:\Python32\Lib") C:Python32Lib >>> print("This is printedin two lines") This is printed in two lines >>> print("This is x48x45x58 representation") This is HEX representation

Raw String to ignore escape sequence

Sometimes we may wish to ignore the escape sequences inside a string. To do this we can place r or R in front of the string. This will imply that it is a raw string and any escape sequence inside it will be ignored.

 >>> print("This is x61 good example") This is a good example >>> print(r"This is x61 good example") This is x61 good example

The format() Method for Formatting Strings

The format() method that is available with the string object is very versatile and powerful in formatting strings. Format strings contain curly braces () as placeholders or replacement fields which get replaced.

We can use positional arguments or keyword arguments to specify the order.

 # Python string format() method # default(implicit) order default_order = "(), () and ()".format('John','Bill','Sean') print('--- Default Order ---') print(default_order) # order using positional argument positional_order = "(1), (0) and (2)".format('John','Bill','Sean') print('--- Positional Order ---') print(positional_order) # order using keyword argument keyword_order = "(s), (b) and (j)".format(j='John',b='Bill',s='Sean') print('--- Keyword Order ---') print(keyword_order)

When we run the above program, we get the following output:

 --- Default Order --- John, Bill and Sean --- Positional Order --- Bill, John and Sean --- Keyword Order --- Sean, Bill and John

The format() method can have optional format specifications. They are separated from the field name using colon. For example, we can left-justify <, right-justify > or center ^ a string in the given space.

Putem, de asemenea, să formatăm numere întregi ca binare, hexazecimale etc., iar flotantele pot fi rotunjite sau afișate în formatul exponentului. Există o mulțime de formatări pe care le puteți utiliza. Vizitați aici pentru toate formatările șirurilor disponibile cu format()metoda.

 >>> # formatting integers >>> "Binary representation of (0) is (0:b)".format(12) 'Binary representation of 12 is 1100' >>> # formatting floats >>> "Exponent representation: (0:e)".format(1566.345) 'Exponent representation: 1.566345e+03' >>> # round off >>> "One third is: (0:.3f)".format(1/3) 'One third is: 0.333' >>> # string alignment >>> "|(:10)|".format('butter','bread','ham') '|butter | bread | ham|'

Formatare în stil vechi

Putem chiar formata șiruri precum sprintf()stilul vechi folosit în limbajul de programare C. Folosim %operatorul pentru a realiza acest lucru.

 >>> x = 12.3456789 >>> print('The value of x is %3.2f' %x) The value of x is 12.35 >>> print('The value of x is %3.4f' %x) The value of x is 12.3457

Metode comune Python String

Există numeroase metode disponibile cu obiectul șir. format()Metoda pe care am menționat mai sus este una dintre ele. Unele dintre metodele utilizate în mod obișnuit sunt lower(), upper(), join(), split(), find(), replace()etc Aici este o listă completă a tuturor built-in metode de a lucra cu siruri de caractere în Python.

 >>> "PrOgRaMiZ".lower() 'programiz' >>> "PrOgRaMiZ".upper() 'PROGRAMIZ' >>> "This will split all words into a list".split() ('This', 'will', 'split', 'all', 'words', 'into', 'a', 'list') >>> ' '.join(('This', 'will', 'join', 'all', 'words', 'into', 'a', 'string')) 'This will join all words into a string' >>> 'Happy New Year'.find('ew') 7 >>> 'Happy New Year'.replace('Happy','Brilliant') 'Brilliant New Year'

Articole interesante...