# Texte (string)

Un texte est une **chaine** de caract√®res.

![typewriter](https://media.giphy.com/media/3o84sqlBujhGoXvTyM/giphy-downsized.gif)

Le texte standard (ASCII code) consiste en
- 26 lettres minuscules (`a-z`)
- 26 lettres majuscules (`A-Z`)
- 10 chiffres (`0-9`)

ainsi que de caract√®res sp√©ciaux:
- ponctuation (`.,;:?!`)
- d√©limiteurs (`(){}[]<>"'`)
- symboles (`$%&`)
- op√©rateurs (`+-*/`)

## Concepts

Les concepts pr√©sent√©s dans ce chapitre sont

- cr√©ation de string `s = 'hello'`
- d√©limitation par un guillemet simple `'` ou double `"`
- caract√®re d'√©chappement `\`

Les indexages
- index simple `s[i]` pour acc√©der √† un seul caract√®re
- tranche `s[m:n]` pour acc√©der √† une sous-chaine
- tranche `s[::i]` avec incr√©ment (2) et chaine invers√©e (-1)

Les fonctions
- `len()` pour retourner la longueur
- `str()` pour transformer nombre en chaine
- `int()` pour transformer chaine en nombre

Les op√©rateurs
- `+` de concat√©nation
- `*` de r√©p√©tition 

## D√©limitation

Une chaine de caract√®res est d√©limit√©e par des guillemets anglais simples `'`.

In [1]:
'hello'

'hello'

ou des guillemets anglais doubles  `"`.  
**Attention**: il ne faut pas confondre le guillemet double `"` (1 caract√®re) avec deux guillemets simples `''` (2 caract√®res).

In [2]:
"world"

'world'

Si le texte contient d√©j√† un guillemet simple (apostrophe), on entoure le texte avec des guillemets doubles.

In [3]:
"c'est bien"

"c'est bien"

Si une chaine contient les deux sortes de guillemets, on les pr√©c√®de avec une barre oblique inverse `\` (backslash) qui est le caract√®re d'√©chappement.

In [35]:
s = 'c\'est "tr√®s" bien'
print(s)

c'est "tr√®s" bien


## Longueur

Une chaine s'appelle **string** en anglais.  
C'est pour cela que nous utilisons souvent ``s`` comme variable pour d√©signer une chaine.  
Par exemple:

In [5]:
s = 'Python'

La fonction `len()` retourne la longueur de la chaine.

In [6]:
len(s)

6

## Index
Chaque caract√®re d'une chaine peut √™tre acc√©d√© par son index (sa position).  
Un index est un nombre entier, commen√ßant avec 0 pour le premier caract√®re.

Voici la premi√®re et deuxi√®me lettre du texte `s`

In [7]:
s[0], s[1]

('P', 'y')

Un index n√©gatif permet d'acc√©der √† une chaine depuis sa fin.
Voici la derni√®re et avant-derni√®re lettre du string `s`.

In [8]:
s[-1], s[-2]

('n', 'o')

## Tranche
Une tranche est un sous-ensemble d'une chaine indiqu√© par indice de la forme `[m:n]`.  
Elle retourne la sous-chaine avec les caract√®res qui ont un indice m √† n-1.

Voici la sous-chaine avec les indices 0, 1, et 2.

In [9]:
s[:3]

'Pyt'

Voici la sous-chaine avec les indices 2 et 3.

In [10]:
s[2:4]

'th'

Voici la sous-chaine avec les indices 3, 4 et 5.

In [11]:
s[3:]

'hon'

Un troisi√®me param√®tre peut donner l'**incr√©ment**.  
Voici la chaine avec les lettres 0, 2, et 4 (√† cause de l'incr√©ment 2).

In [12]:
s[::2]

'Pto'

Un incr√©ment n√©gatif (-1) **inverse** la chaine.

In [13]:
s[::-1]

'nohtyP'

## Une chaine est immuable

Contrairement √† une liste, une chaine est **immuable**.  
Essayer de r√©affecter une lettre, donne une erreur.

    s[0] = 'J'
    TypeError: 'str' object does not support item assignment
    
Par contre c'est possible de cr√©er une nouvelle chaine.  
Nous pouvons concat√©ner une lettre et une tranche d'une chaine existante, pour en former une nouvelle chaine.

In [14]:
'J' + s[1:]

'Jython'

## Op√©rateur de concat√©nation

L'op√©rateur `+` permet de concat√©ner (encha√Æner) deux textes.

In [15]:
a = 'hello'
b = 'world'

La concat√©nation donne

In [16]:
a + b

'helloworld'

Nous pouvons ajouter une espace au milieu.

In [17]:
a + ' ' + b

'hello world'

Nous pouvons ajouter un retour √† la ligne (`\n`) au milieu.

In [18]:
print(a + '\n' + b)

hello
world


## Op√©rateur de r√©p√©tition

L'op√©rateur `*` permet de r√©p√©ter un texte.

In [19]:
'hi' * 20

'hihihihihihihihihihihihihihihihihihihihi'

In [20]:
a * 5

'hellohellohellohellohello'

Maintenant, l'op√©rateur `*` signifie la multiplication

In [21]:
12 * 12

144

Nous pouvons utiliser des parenth√®ses pour fixer la priorit√©.

In [22]:
(a + ' ') * 5

'hello hello hello hello hello '

## Caract√®re d'√©chappement
En informatique et en t√©l√©communication, un caract√®re d'√©chappement est un caract√®re qui d√©clenche une interpr√©tation alternative du ou des caract√®res qui le suivent. En Python nous avons la **barre oblique invers√©e** comme caract√®re d'√©chappement.

- `\n` pour un retour √† la ligne (=newline)
- `\t` pour un tabulateur
- `\\` pour √©chapper le caract√®re d'√©chappement.
- `\'` pour un guillemet simple
- `\"` pour un guillemet double

Le tabulateur aligne un texte √† des multiples de 8.

In [23]:
print('hello\tworld')
print('1\t2')

hello	world
1	2


Le `\n` (newline) ins√®re un retour √† la ligne.

In [24]:
print('hello\nworld')

hello
world


La premi√®re et la troisi√®me barre oblique sont √©chapp√©es.

In [25]:
print('tab=\\t \tnewline=\\n\n1\t2')

tab=\t 	newline=\n
1	2


## Unicode

Les chaines de caract√®res utilisent Unicode. Le format **Unicode** permet de cr√©er des caract√®res et alphabets de presque toutes les langues du monde.

Voici une chaine en japonais avec une sous-tranche.

In [34]:
jap = '„Åì„Çå„ÅØÊó•Êú¨Ë™û„Åß„Åô'  # kore wa nihongo desu
jap[3:6]               # nihongo

'Êó•Êú¨Ë™û'

Voici une chaine qui utilise des √©mojis.

In [27]:
emoji = 'üçèüçéüçêüçäüçãüçåüçâüçáüçì'

Voici deux √©mojis r√©p√©t√©s 10 fois.

In [28]:
'üçéüçè' * 10

'üçéüçèüçéüçèüçéüçèüçéüçèüçéüçèüçéüçèüçéüçèüçéüçèüçéüçèüçéüçè'

## Type d'un objet

La fonction `type()` retourne le type d'un objet.  
Le type d'une chaine est `str` (=string).

In [29]:
type('abc')

str

Voici trois autres types:
- `int` (entier)
- `float` (virgule flottante
- `bool` (bool√©en)

In [30]:
type(1), type(1.2), type(True)

(int, float, bool)

## Conversion

Un nombre peut √™tre pr√©sent√© comme chaine.  
L'op√©rateur `*` signifie alors la r√©p√©tition.

In [31]:
'12' * 12

'121212121212121212121212'

Maintenant, l'op√©rateur `*` signifie la multiplication

In [32]:
12 * 12

144

La fonction `int()` transforme une chaine (qui repr√©sente un entier) en entier.

In [33]:
int('12')

12

L'op√©rateur inverse `str()` transforme un nombre en string.

In [34]:
str(123)

'123'