Ce n'est qu'aujourd'hui, plus de dix ans après mes premiers contacts avec la langue espagnol au collège et six mois passés en Espagne que je m’aperçois que je suis passé à côté de certaines règles élémentaires de la prononciation de certaines consonnes. L'exemple le plus frappant est celui de la lettre "g". J'ai appris au collège et au lycée que cette lettre se prononce différemment en fonction de la lettre qui la suit :
Ce que je viens d'apprendre est que la disjonction de cas ci-dessus manque une importante subtilité. En effet, le second point ne s'applique que si le "g" est la première lettre du mot, ou se situe après une consonne nasale. Le reste du temps, c'est-à-dire entre deux voyelles (on parle d'intervocalique), le "g" se prononce /ɣ/, une consonne fricative vélaire voisée qui n'existe pas en français mais qui est relativement proche de la prononciation [ʁ] de notre lettre "r", par exemple dans le prénom "Lara". Le mot espagnol "haga", subjonctif présent du verbe "hacer", se prononcera donc quasiment comme ce prénom (exceptée, évidemment, la première consonne).
Pour conclure, mentionnons qu'un phénomène similaire existe pour les lettres "d" et "b", qui changent légèrement de prononciation selon les lettres qui les entourent.
Defining what is the fundamental group of an orbifold is a subtle task. Here I briefly explain why the naive definition is not correct, and then give an idea of the correct definition. For simplicity we work on the example $\mathbb{C}/\mathbb{Z}_2$ -- generalizing to an arbitrary orbifold is easy.
The naive way to think about an orbifold is just as a quotient space. Namely, $\mathbb{C}/\mathbb{Z}_2$ would then be the space of equivalence classes of points of $\mathbb{C}$ under the $\mathbb{Z}_2$ action, $\mathbb{C}/\mathbb{Z}_2 = \left\{\left\{z,-z \right\} | z \in \mathbb{C} \right\}$. Let us compute the fundamental group of this space. It is obvious that the problematic curves are in the homotopic class of \begin{eqnarray} [0,1] &\rightarrow& \mathbb{C}/\mathbb{Z}_2 \\ t& \mapsto& \{ e^{\pi i t} , - e^{\pi i t} \} \, . \end{eqnarray} This is indeed a closed loop, since $\{1,-1\} = \{-1,1\}$. The question is whether it is homotopic to the trivial loop that sits at the point $\{1,-1\}$ or not. Let us show that this loop \emph{is} homotopic to the trivial loop. Define \begin{equation} f_a (t) = \{\pm (\cos (\pi t) + i a \sin (\pi t))\} \, \qquad g_a (t) = \{\pm ((1-a) |\cos(\pi t)| + a)\} \, . \end{equation} The loop $f_1$ is the initial loop, while $f_0$ which is obviously in the same class, passes through the origin. We have $g_0 = f_0$, and $g_1$ is the trivial loop. So $f_1 \rightarrow f_0 = g_0 \rightarrow g_1$ shows that we can continuously deform the original loop to the trivial loop. We conclude that $\pi_1 (\mathbb{C}/\mathbb{Z}_2) = 1$.
The point is precisely that an orbifold is more than a mere quotient space, a fact that mathematicians emphasize by denoting $\mathbb{C}//\mathbb{Z}_2$ the orbifold. In this respect, the physics literature is very sloppy (see for instance the definition as a quotient space of the term 'orbifold' at the end of Polchinski's book). This is why it is difficult to define the fundamental group as a group of (equivalence classes of) loops: defining what a loop is is very cumbersome. This is done in Ratcliffe's book "Foundations of Hyperbolic Manifolds". In his lecture notes about orbifolds, Michael Davis gives four definitions of $\pi_1$ for an orbifold, after suggesting that when the concept of orbifold was first introduced by Satake under the name of V-manifolds, those definitions were missing:
Thurston's big improvement over Satake's earlier version [...] was to show that the theory of covering spaces and fundamental groups worked for orbifolds. (When I was a graduate student a few years before, this was "well-known" not to work.)
I don't want to go into the details of the definition of an orbifold loop here, and usually people working with the fundamental group of orbifolds don't either ! More useful is the following construction. Many orbifolds[1. For the other orbifolds, the bad ones, there is also a concept of universal cover, but in this case this cover is itself a non-trivial orbifold. ] (those that Thurston calls "good") admit a cover which is a simply connected manifold, which we call the universal cover. The homeomorphisms of this cover that commute with the projection on the orbifold are called the deck transformations. They naturally form a group, and this group is precisely what we call the fundamental group of the orbifold. In the above example, the cover is $\mathbb{C}$, and the only homeomorphism that commutes with the projection is $z \mapsto -z$. We find $$\pi_1^{\textrm{orb}} \left( \mathbb{C}//\mathbb{Z}_2 \right) = \mathbb{Z}_2 \, . $$
In 1996, Seiberg wrote a fundamental paper about the basics of five-dimensional supersymmetric field theories. [1. Here we will consider the minimal amount of supersymmetry, which is 8 real supercharges. ] In five dimensions, the gauge coupling constant is dimensionful : for $\frac{1}{g_{YM}^2} F^2$ to have mass-dimension five, we need $\frac{1}{g_{YM}^2}$ to have the dimension of a mass. So naively, those theories are not very interesting: at low energy, the gauge coupling vanishes, while in the UV it diverges, signaling that the theory is non-renormalizable. Nevertheless, we will see that those theories can be seen as relevant perturbations of a $5d$ UV-complete SCFT, which corresponds to the infinite-coupling limit. This surprising construction is the object of this short note.
First, what is the field content of the theory? Well, the only constraint is that it should fit in representations of the superalgebra. We will focus on massless fields, and this leaves us with two types of representations:
Let us first focus on the hero of our story, the vector multiplet, without whom there is no gauge theory. Arguments related to the $4d$ theory obtained by compactification show that the Lagrangian is determined by a prepotential of the form $$\mathcal{F} = \frac{1}{g_{YM}^2} \mathrm{tr} \Phi^2 + \frac{\kappa}{6}\mathrm{tr} \Phi^3 \, . $$ From this we obtain a Lagrangian as follows:
We see that $\kappa$ is absolutely crucial to have a non-trivial theory. In fact, this term is generated by an anomaly, at one loop. Moreover, although the theory is a priori not UV-finite, $\kappa$ is finite and doesn't depend on the coupling constant nor on the cutoff. Let us consider a single vector multiplet with gauge group $SU(2)$. One computes that the anomaly generates $\kappa = 2(8-N_f)$, where $N_f$ is the number of quarks and $8$ is the contribution of the vector multiplet. Moreover, in this theory the effective coupling constant is given by $$\frac{1}{g_{eff}^2} =\frac{1}{g^2} + 16 \phi - \sum |\phi - m_i| - \sum |\phi + m_i| \, , $$ where the sum is over the quarks with masses $m_i$. The crucial observation is that for $N_f < 8$, the right-hand side is bounded from below on the Coulomb branch $\mathbb{R}_+$. This means that starting from $g=0$ we can increase $g \rightarrow \infty$ and still have a finite value of $g_{eff}$, provided $\phi$ is sufficiently large.
This theory can be realized on a brane setup, and in the infinite coupling limit, the theory is at a non-trivial fixed point where the global symmetry $SO(2N_f) \times U(1)$ is enhanced to $E_{N_f+1}$. To understand how this is done, we just need to recall below a few things about type I and I' string theories, and then about the appearance of $E_8$ in string theory.
Quelques photos de la randonnée de samedi dernier, 19 novembre 2016. Nous avons fait l'ascension de la Peña Mea.
Dimanche matin, de grosses vagues étaient prévues. Même si elles n'étaient finalement pas vraiment au rendez-vous, cela m'a donné l'opportunité rare de voir le lever du soleil à Salinas.
J'ai commencé dans un précédent article à parler du groupe fondamental, et nous avons vu quelques exemples simples. Les groupes obtenus étaient toujours le groupe des entiers $\mathbb{Z}$, ou éventuellement plusieurs copies de ce groupe dans le cas des tores. On pourrait croire que le groupe fondamental d'un espace est toujours de cette forme : un facteur $\mathbb{Z}$ pour chaque trou autour duquel on peut enrouler des lacets, et c'est tout. Mais nous allons voir ici que la vérité est très loin de cela.
Certes, un tore possède deux cycles indépendants autour desquels on peut enrouler des lacets. Mais un tore a une propriété très spéciale : enrouler autour d'un cycle A puis autour de B est la même chose qu'enrouler autour de B puis de A. Autrement dit, le groupe est commutatif. On peut facilement visualiser cela sur un tore bi-dimensionnel, vu comme un carré aux bords identifiés, comme sur le dessin ci-dessus.
Groupe fondamental du chiffre 8
Mais considérons maintenant deux cercles accolés pour former la figure d'un chiffre 8. A présent, le lacet $ab$ est différent de lacet $ba$ (il est important de garder à l'esprit que le point de départ et d'arrivée est choisi une fois pour toutes, par exemple à l'intersection $I$ des deux cercles). On se convainc alors que le groupe fondamental est l'ensemble des mots de la forme $a^{n_1}b^{n_2}a^{n_3}b^{n_4}\cdots$ avec les $n_i$ des entiers relatifs quelconques. Ce groupe est le produit libre de deux copies de $\mathbb{Z}$, noté : $$\pi_1 ("8") = \mathbb{Z} \star \mathbb{Z} \, . $$ Il faut bien se rendre compte que ce groupe est énorme, beaucoup plus gros que $\mathbb{Z}^2$ (si on veut, on peut voir $\mathbb{Z}^2$ comme l'ensemble des mots $a^{n_1}b^{n_2}$, avec seulement deux entiers $n_1,n_2$).
Le subtil produit libre
Plus généralement, on définit le produit libre d'une famille de groupes $G_{\alpha}$ (où $\alpha$ est un indice prenant un nombre fini ou infini de valeurs) comme l'ensemble des mots de la forme $g_1 g_2 \cdots$ où chaque $g_i$ appartient à l'un des groupes, n'est pas trivial, et $g_i$ et $g_{i+1}$ appartiennent forcément à des groupes différents. Cet ensemble est muni d'une structure de groupe naturelle (on fait des simplifications dès que c'est possible, c'est la seule règle !). La simplicité de cette définition cache de redoutables complexités, dont je donne quelques exemples ci-dessous, mais cela n'est pas essentiel pour la suite (ceux qui ne sont intéressés que par la topologie peuvent sauter jusqu'au paragraphe suivant).
Considérons par exemple $\mathbb{Z}_2 \star \mathbb{Z}_2 $. Dans $\mathbb{Z}_2$, il n'y a qu'un élément non-trivial, donc on n'a pas bien le choix, chaque lettre $g_i$ doit être soit le générateur du premier soit celui de second $\mathbb{Z}_2$. Autrement dit, on considère tous les mots de la forme $\cdots ababab \cdots$. C'est un groupe infini, ce qui n'est pas mal quand on se rappelle qu'on est parti du produit libre avec lui-même du plus simple de tous les groupes, qui n'a que deux éléments. En fait, la structure est tout de même relativement facile à découvrir : $$ \mathbb{Z}_2 \star \mathbb{Z}_2 \cong \mathbb{Z} \rtimes \mathbb{Z}_2 $$ où $\mathbb{Z}$ est généré par $ab$ (qui est bien d'ordre infini) et $\mathbb{Z}_2$ par $a$. Il est assez facile de voir cette structure sur un dessin qui construit systématiquement tous les éléments du groupe :
Passons à l'exemple suivant, en termes de complexité : $\mathbb{Z}_2 \star \mathbb{Z}_3 $. Ici, si l'on note toujours $a$ et $b$ les générateurs des deux facteurs, on a maintenant le droit d'utiliser $b$ et $b^2$. Et cela change tout ! Alors que dans le cas précédent, la construction du groupe était linéaire parce qu'à chaque étape, on ne pouvait ajouter qu'une seule lettre, ici on a deux choix à une étape sur deux, comme illustré sur la construction ci-dessous :
Théorème de Van Kampen et applications
Énonçons maintenant le théorème clé qui permet de calculer un tas de groupes fondamentaux. Pour cela, considérons un espace $X$ recouvert par des ouverts $A_i$ contenant le point de base $x_0$ tels que tous les $A_i$, tous les $A_i \cap A_j$ et tous les $A_i \cap A_j \cap A_k$ sont connexes par arcs. Alors $$\pi_1(X) = \left( \star_i \, \pi_1(A_i) \right) / N$$ où $N$ est le sous-groupe normal généré par tous les éléments $\omega_i \omega_j^{-1}$ où $\omega \in \pi_1 (A_i \cap A_j)$ et $\omega_i$ est cet élément vu comme élément de $\pi_1 (A_i)$. Ce théorème est appelé le théorème de Van Kampen.
Pour notre exemple ci-dessus du chiffre 8, il est clair que l'on peut choisir chacun des cercles comme un ouvert dont on connait le groupe fondamental. Comme l'intersection est réduite à un point, le groupe $N$ est trivial, et on en déduit immédiatement que le groupe fondamental du chiffre 8 est $\mathbb{Z} \star \mathbb{Z}$. Si on rajoute une boucle de plus, comme dans la figure ci-dessous, on peut prendre pour ouverts un cercle et un chiffre 8, ce qui nous donne un groupe fondamental isomorphe à $\mathbb{Z} \star \mathbb{Z} \star \mathbb{Z}$.
La prochaine fois nous verrons que l'on peut utiliser ce théorème pour calculer le groupe fondamental d'un très grand nombre d'espaces. Et si vous croyez que nous allons toujours obtenir des produits libres comme ici, vous ne pouvez pas plus vous tromper : en effet, nous allons voir que pour tout groupe $G$, quel qu'il soit, il existe des espaces ayant $G$ pour groupe fondamental !
Anomalies in four-dimensional CFTs
The title of this post might be confusing: I'm not talking about a maximization in general, but about the maximization of the anomaly coefficient $a$ ! Let us first recall what we are talking about. We consider a conformal field theory (CFT) in four dimensions, with its energy-momentum tensor $T_{ \mu\nu}$, whose trace vanishes in the vacuum, $\langle T_{\mu}^{\mu}\rangle = 0$. At least this is true in flat space, but if we go to curved space, an anomaly appears, under the form $$\langle T_{\mu}^{\mu}\rangle = \frac{c}{(4\pi)^2} \textrm{Weyl}^2 - \frac{a}{(4\pi)^2} \textrm{Euler} \, . $$ In this equation, we have two important tensors of Riemannian geometry in four dimensions, the Weyl tensor which describes how the shape of an object is transformed when one moves, and the Euler tensor whose integral gives the Euler characteristic. You can look here for precise definitions with normalizations. In a free theory, there are generic formulas: $$c = \frac{1}{120}(N_s + 6N_f + 12 N_v) \qquad a = \frac{1}{360}(N_s + 11 N_f + 62 N_v)$$ where $N_s$ is the number of real scalars, $N_f$ the number of Dirac spinors and $N_v$ the number of vectors. For instance, a free $\mathcal{N}=2$ full hypermultiplet is made of two complex scalars (or four real scalars) and one Dirac spinor (or two Weyl spinors), which gives $c=1/12$ and $a=1/24$. But the formulas above are valid for any free CFT, be it supersymmetric or not.
Supersymmetry comes in
What happens if we consider $\mathcal{N}=1$ theories? Then there is always a $U(1)_R$ symmetry, which is part of the bosonic symmetry $SO(4,2) \times U(1)_R$ of the superconformal algebra $SU(2,2 | 1)$. The $R$-symmetry current belongs to the same superconformal multiplet as the stress-energy tensor, and for that reason it is also connected to the anomaly coefficients $a$ and $c$. For instance, one has $$a = \frac{3}{32}(3 \mathrm{Tr} \, R^3 - \mathrm{Tr} \, R) \, . $$ This is valid even for strongly coupled theories, and it provides a very efficient way to compute $a,c$ for these theories.
But where there is also a flavor symmetry in the theory, we can always redefine the $R$-charges by a combination of the global charges, $$R \rightarrow R + s_i F^i$$ where $F^i$ are the non-$R$-charges in the flavor symmetry algebra. Although one can somewhat restrict this freedom of redefinition by physical requirement, this is not enough in general to find the right $R$-symmetry that has the nice relations with anomalies. An outstanding result obtained by Intriligator and Wecht in 2003 is that this $R$-symmetry is the one that maximizes the quantity $$a(s) = \frac{3}{32}(3 \mathrm{Tr} \, R(s)^3 - \mathrm{Tr} \, R(s)) \, . $$ This is the $a$-maximization principle.
As a conclusion, let us prepare the next episode of our Histoire d'A with the following comment. If we consider a flow between a UV SCFT and an IR SCFT, in general the flavor symmetry group gets reduced in the process, because in order to start the flow, we have introduced a deformation that may have broken part of the flavor symmetry. Therefore, the space where the $s_i$ live becomes smaller, and there is less space for maximization. This seems to imply that $$a_{IR}<a_{UV}$$. In fact, it is not entirely correct because there might be an accidental additional symmetry in the IR that spoils the reasoning. So we need more to prove the $a$ theorem (this is the name of the above inequality), and I leave this for the second episode.
These last two days, two papers appeared on related subjects. Broadly speaking, they deal with $\mathcal{N}=(2,2)$ theories in two dimensions. Another common feature is that Seiberg is one of the authors in both articles:
Today I will talk briefly about the second of these articles, emphasizing what I consider to be a very neat explanation of a principle that might seem counter-intuitive, if not paradoxal.
The paper deals with (super)conformal theories. Such theories have a conformal manifold, parametrized by exactly marginal couplings. For $\mathcal{N}=(2,2)$ theories, this manifold factorizes locally as \begin{equation} \label{fac} \mathcal{M} = \mathcal{M}_c \times \mathcal{M}_{tc} \end{equation} where the two factors are Kähler manifolds parametrized by the coupling constants of the exactly marginal operators constructed from the chiral and twisted chiral rings. But this seems to contradict the old fact that the conformal manifold of $\mathcal{N}=(4,4)$ SCFTs is locally of the form $$\frac{O(4,n)}{O(4)\times O(n)} , $$ which does not factorize and is not even Kähler! This seems contradictory, because of course $\mathcal{N}=(4,4)$ SCFTs can be seen as particular $\mathcal{N}=(2,2)$ SCFTs.
This situation is a very nice example where more symmetry invalidates generic results. The memo would be:
A more symmetric situation is not merely a particular case of a less symmetric situation.
Here $R$-symmetry is responsible for this unusual behavior: in a generic $\mathcal{N}=(2,2)$ SCFT the $R$-symmetry is $U(1)$, and in more symmetric models it is enhanced to a non-abelian group. It means that more symmetry adds new fields (here, the currents associated to the enhanced symmetry), and these fields can spoil properties of the less symmetric and more generic theories, like the factorization above. Finally, we obtain the strange-sounding, but now understandable, statement:
The factorization (\ref{fac}) breaks down only if the supersymmetry is larger than $\mathcal{N}=(2,2)$.
Another example of this principle can be found in four-dimensional supergravity. The target space of $\mathcal{N}=1$ supergravity is Kähler, but for $\mathcal{N}=2$ it is quaternionic and not Kähler. There is no contradiction because the latter theory has additional multiplets that are not present in a general $\mathcal{N}=1$ theory.
One of the main ideas of the paper is that the usual Seiberg trick of promoting coupling constants in the Lagrangian to background superfields might not work with a bigger symmetry because in that case one has to be careful about anomalies.
Today I summarize part of the relation between integrable systems and gauge theories that was presented in 2009 by Nekrasov and Shatashvili in a series of papers (see references below).
The Bethe-Gauge correspondence
The first correspondence that I review applies to two-dimensional gauge theories. Consider for instance a two-dimensional theory with $\mathcal{N} = (2,2)$ supersymmetry. The supersymmetric vacua of this theory correspond to the stationary eigenstates of a quantum integrable system, and we have a quite complete dictionary between the two sides of the correspondence: \begin{tikzpicture} [+preamble] \usepackage{tikz} \usetikzlibrary{arrows} \tikzstyle{arrow} = [thin,->,>=angle 60] [/preamble] \node[draw,text width=6cm,align=center](1) at (0cm,0cm) {$2d$ gauge theory with $\mathcal{N} = (2,2)$ supersymmetry}; \node[draw,text width=6cm,align=center](2) at (9cm,0cm) {Intrinsically quantum integrable system (no continuous Planck constant)}; \node[text width=6cm,align=center](3) at (0cm,-2cm) {Finite-dimensional space of susy vacua}; \node[text width=6cm,align=center](4) at (9cm,-2cm) {Finite-dimensional Hilbert space}; \node[text width=6cm,align=center](5) at (0cm,-4cm) {Generators of the twisted chiral ring $\mathcal{O}_k$ and their expectation values}; \node[text width=6cm,align=center](6) at (9cm,-4cm) {Hamiltonians of the integrable system and their eigenvalues}; \node[text width=6cm,align=center](7) at (0cm,-6cm) {Coulomb branch moduli $\sigma_i$}; \node[text width=6cm,align=center](8) at (9cm,-6cm) {Spectral parameters $\lambda_i$}; \node[text width=6cm,align=center](9) at (0cm,-8cm) {Effective twisted superpotential $\tilde{W}^{\textrm{eff}} (\sigma)$}; \node[text width=6cm,align=center](10) at (9cm,-8cm) {Yang-Yang function $Y (\lambda)$}; \draw[] (1) -- (2); \draw[] (3) -- (4); \draw[] (5) -- (6); \draw[arrow] (5) -- node[anchor=east]{acts on}(3); \draw[arrow] (6) -- node[anchor=west]{acts on}(4); \draw[] (7) -- (8); \draw[] (9) -- (10); \end{tikzpicture}
[showhide type="pressrelease" more_text="Details" less_text="Hide" hidden="yes"] Let us explain briefly how this is obtained. In a theory with $\mathcal{N} = (2,2)$, we can call $Q_{\pm , \pm}$ the four real supercharges, and define $$Q_A = Q_{+,+} + Q_{-,-} \qquad Q_B = Q_{+,-} + Q_{-,-} . $$ Those two combinations correspond to two inequivalent twists, called the $A$-twist and the $B$-twist. Here we focus on the former. One crucial property is $$Q_{A}^2 = 0 \qquad \{Q_A , Q_A^{\dagger} \} = H $$, so we can consider the cohomology $ \mathcal{H}^{\textrm{quantum}} = \textrm{Ker} Q_A / \textrm{Im} Q_A$. The name we have given to this space reflects the fact that it is the space of states of some quantum integrable system.
To understand this, one has to introduce the twisted chiral ring, which is generated by the operators that (anti-)commute with $Q_A$. Let us call $\mathcal{O}_i$ a basis of such operators. The fact that they generate a ring comes from the operator product expansion $$ \mathcal{O}_i \mathcal{O}_j = c_{ij}^k \mathcal{O}_k + \{ Q_A , \cdots \} . $$ So indeed when we neglect all $Q_A$-exact quantities, we have an honest ring. But now if $| 0 \rangle$ is a vacuum state of the Hamiltonian, $H | 0 \rangle = 0$, then because of the commutation relations $|i\rangle = \mathcal{O}_i | 0 \rangle$ is as well, and moreover $$ \mathcal{O}_i |j\rangle = c_{ij}^k |k \rangle \, . $$ The supersymmetric vacua form a representation of the ring. This gives a hint of why the $\mathcal{O}_i$ will be identified with the Hamiltonians of the quantum integrable system. [/showhide]
We still have to explain why the name "Bethe" is used here! This comes from the fact that in most interesting cases, at low energy on the Coulomb branch the theory becomes abelian. It is then possible to compute exactly an effective twisted superpotential $\tilde{W}^{\textrm{eff}} (\sigma)$, which allows to determine the supersymmetric vacua by solving an extremization problem. But one has to be careful because of integer-valued electric fluxes, and this is taken care of by solving $$ \boxed{\exp \left( \frac{\partial \tilde{W}^{\textrm{eff}} (\sigma)}{\partial \sigma^i}\right) = 1 } $$ This equation coincides with the Bethe equation determining the exact spectrum of the quantum integrable system. In this context $\tilde{W}^{\textrm{eff}} (\sigma)$ is known as the Yang-Yang function $Y(\lambda)$.
The four-dimensional story
There is a nice analog of the two-dimensional discussion above to four-dimensional theories. Here I simply quote the main ideas one has to remember.
Note first that a $4d$ theory can be seen as a $2d$ theory with an infinite number of fields! This is in essence why the space of vacua and the Hilbert space of the corresponding integrable system will be infinite-dimensional. An other very important point here is that we have a continuous parameter $\epsilon$ that plays the role of the Planck constant $\hbar$. On the gauge theory side, it appears in the partial $\Omega$-deformation. When this Planck constant is set to zero, we recover a classical integrable system associated to a field theory on $\mathbb{R}^4$: this is simply the Donagi-Witten integrable system.
We can sketch an analog diagram, without entering further into details here: \begin{tikzpicture} [+preamble] \usepackage{tikz} [/preamble] \node[draw,text width=6cm,align=center](1) at (0cm,0cm) {$4d$ gauge theory with $\mathcal{N} = 2$ supersymmetry on $\Omega$-background with $\epsilon_1 = \epsilon$ and $\epsilon_2 = 0$}; \node[draw,text width=6cm,align=center](2) at (9cm,0cm) {Quantum integrable system with Planck constant $\hbar = \epsilon$}; \node[text width=6cm,align=center](3) at (0cm,-2cm) {Infinite dimensional space of supersymmetric vacua}; \node[text width=6cm,align=center](4) at (9cm,-2cm) {Infinite dimensional space of stationary eigenstates}; \draw[] (1) -- (2); \draw[] (3) -- (4); \end{tikzpicture} As nicely summarized in section 5.2 of this review by Teschner, this correspondence was the starting point of a series of developments on both sides. Note in particular this paper by Nekrasov and Witten where the link between the $\Omega$-deformation and the AGT correspondence is elucidated.
References
Dans un article précédent, j'ai présenté une façon de représenter des fonctions complexes, c'est-à-dire des fonctions $f : \mathbb{C} \rightarrow \mathbb{C}$, à l'aide d'un jeu de couleurs. Tout ceci n'était qu'un prétexte pour introduire l'une des fonctions les plus fascinantes à mon goût, qui répond au simple nom de "fonction $j$", ou parfois de $j$-invariant.[1. et si l'on veut être encore plus précis, on dit que c'est l'invariant $j$ de Klein] Il s'agit d'une fonction définie sur $$\mathfrak{H} = \{ \tau \in \mathbb{C} | \textrm{Im} \, \tau > 0\}. $$ et à valeurs dans $\mathbb{C}$. Je ne vais pas expliquer tout de suite comment elle est définie, mais plutôt en donner une propriété qui, fait peut-être surprenant, la caractérise de façon unique. Pour cela, il faut que je rappelle ce que sont les transformations modulaires.
Voici deux opérations fort simples qui agissent sur $\mathfrak{H}$: $$T : \tau \mapsto \tau +1$$ $$S : \tau \mapsto \frac{-1}{\tau} . $$ Je vous laisse vérifier que ces deux opérations agissent bien sur $\mathfrak{H}$, c'est-à-dire que si on leur donne un nombre complexe de partie imaginaire strictement positive en argument, elles renvoient un nombre complexe de partie imaginaire strictement positive. Une fois qu'on a ces deux opérations, on peut en construire beaucoup d'autres en les combinant. Par exemple, $ST$ sera la composée de $T$ suivie de $S$, ce que l'on note parfois $S \circ T$, et je vous laisse vérifier que $$ST : \tau \mapsto \frac{-1}{\tau+1} . $$ J'expliquerai une prochaine fois[2. Je mettrai le lien ici quand ce sera fait !] pourquoi ces transformations sont importantes. Mais pour le moment, posons-nous le problème suivant. Quelles sont les fonctions $f : \mathfrak{H} \rightarrow \mathbb{C}$ holomorphes (c'est-à-dire dérivables au sens complexe) qui sont invariantes sous les deux transformations $S$ et $T$ (et donc automatiquement sous toutes les compositions possibles), autrement dit, les fonctions telles que $$\forall \tau \in \mathfrak{H} , \qquad f(\tau) = f(\tau +1) = f (-1/\tau) ? $$ La réponse n'est pas du tout évidente, car ces deux transformations sont assez vicieuses. $T$ semble sympathique, elle dit simplement que $f$ doit être périodique, donc $\sin (2 \pi \tau)$ pourrait faire l'affaire. Mais $S$ relie $\tau$ et $-1/\tau$. En soi, cela n'est pas extraordinaire, et n'importe quel polynôme en $\tau - 1/\tau$ possède cette invariance. Ce qui est vicieux, c'est que ces deux transformations semblent hautement incompatibles, car par exemple $f$ doit rester périodique de période $1$ même après avoir subi $S$, donc $$f(\tau) = f \left( \frac{-1}{\tau +n}\right)$$ pour tout entier $n$ ! Je vous mets au défi de trouver des fonctions satisfaisant cette condition.
L'invariant de Klein $j$
Mais vous l'avez sans doute deviné, la fonction $j$ possède cette propriété : $$\forall \tau \in \mathfrak{H} , \qquad j(\tau) = j(\tau +1) =j (-1/\tau) .$$ Mieux, d'une certaine façon, c'est la seule, dans le sens où l'ensemble des fonctions $f$ holomorphes invariantes par $S$ et $T$ est exactement $\mathbb{C}[j]$, l'ensemble des polynômes en $j$. Parmi toutes ces fonctions, $j$ est la seule qui s'annule en $e^{2 \pi i /3}$, et vérifie $j(i) = 1728$, et ceci fournit donc une définition, certes fort indirecte. Je donnerai plus tard une définition plus constructive, mais regardons pour le moment comment cette fonction satisfait les propriétés de symétrie mirifiques annoncées. Voici l'image :
On remarque tout de suite la $1$-périodicité. De même, les plus attentifs auront remarqué qu'il y a des zéros d'ordre trois (les points noirs desquels partent trois lignes rouges), en particulier en $e^{2 \pi i /3}$ comme annoncé, mais aussi à beaucoup d'autres endroits. Comment se rendre compte de l'action de $S$? Pour cela, mieux vaut se restreindre à un secteur de forme un peu particulière :
Ce secteur a la propriété que $j$ y induit une bijection vers $\mathbb{C}$ : tout nombre complexe est représenté une et une seule fois sur l'image ci-dessus, en supposant qu'elle s'étende infiniment vers le haut (et en traitant correctement les frontières). Appliquer $T$ à ce secteur est simplement la translation par $1$, qui ne change pas l'image. En revanche l'image de ce domaine par $S$ est le suivant :
En fait, à condition de placer la bonne métrique sur $\mathfrak{H}$, cette image est la rotation de la précédente autour du point $i$. C'est de cette façon que l'on doit voir la transformation $S$ ! Je peux maintenant effectuer des translations "déformées", dans la direction des côtés bleus clairs. Cela correspond à la symétrie $ST$ :
En fait, on se rend compte que $j$ a effectué un coloriage d'une certaine triangulation de $\mathfrak{H}$, qui le pave entièrement. Finalement, toute la complexité des transformations $S$ et $T$ semble résider dans cette triangulation. Quitte à être un peu lourd, je voudrais insister sur le fait que $j$ est invariant par $S$ et par $T$, au moyen de ce joli diagramme, dans lequel la flèche verte représente $T$, et la rouge représente $S$ :
C'est un peu Much Ado About Nothing, mais c'est tellement important que cette leçon vaut bien un fromage diagramme, sans doute. Les plus observateurs auront noté que la flèche de $S$ a deux extrémités. C'est normal, quelque soit l'objet sur lequel $S$ agit, on a $S^2 = 1$. Pour $T$, ce n'est évidemment pas le cas en général, même si c'est clairement le cas ici pour $j$.
Du côté des valeurs réelles de $j$
Regardons de plus près l'ensemble des points où $j(\tau)$ est réel. Il s'agit d'une triangulation, assez proche de la triangulation dont nous venons de parler. En fait, il suffit de couper chaque triangle en son milieu, le long de la ligne rouge. On obtient ainsi un pavage triangulaire, chaque triangle possédant
Il est amusant de calculer que la somme des angles de chaque triangle vaut $\frac{5\pi}{6}$, ce qui est plus petit que la valeur que l'on pouvait attendre, $\pi$. L'explication est simple : nous sommes dans un espace hyperbolique. Dans ces espaces, il y a même une façon simple de calculer l'aire d'un triangle : $$\mathrm{Aire} = \pi - \sum\limits_{\textrm{angles } \alpha} \alpha . $$ Notons qu'il n'est pas nécessaire de définir une unité arbitraire dans un espace hyperbolique, comme le mètre, le mile ou le pied ! L'unité est fournie par la courbure (ici, négative), de l'espace lui-même. Il en va de même dans un espace de courbure positive. Donc pour nos triangles, l'aire vaut $\frac{\pi}{6}$. Notons que pour les triangles deux fois plus gros qui sont utilisés dans les figures ci-dessus, les angles valent $0$, $\frac{\pi}{3}$ et $\frac{\pi}{3}$, ce qui donne une aire de $\frac{\pi}{3}$, qui vaut bien le double de $\frac{\pi}{6}$. Ouf, les aires sont toujours bien additives ! Mais reprenons l'étude de $j$. Ses valeurs sur les bords des triangles sont (naturellement !) :
Tout ceci est, vous l'admettrez certainement, assez joli. Mais à quoi ça sert ? A comprendre certaines choses un peu sauvages.
Sortir du cadre
Jusqu'à maintenant, nous sommes restés dans le terrain bien connu de la fonction $j$, analysée, à partir des images, en assez grand détail. Les lecteurs fidèles se souviendront que le plus amusant, dans le post précédent, c'étaient les coupures. Et si on en ajoutait sur notre belle fonction $j$ ? Le plus simple, pour cela, est de considérer la fonction $$k_{j_0}(z) = \sqrt{j(z)-j_0} , $$ avec $j_0 \in \mathbb{R}$. Si l'on prend la convention (la plus usuelle) de placer la coupure sur les points où l'argument de la racine carrée est un réel négatif, ces coupures vont se placer le long de notre réseau triangulaire réel étudié précédemment. Plus précisément, le long des côtés où $j(z)<j_0$. Si $j_0<0$, il s'agira simplement d'une portion du côté $]\infty , 0[$. L'autre cas extrême est $j_0 >1728$, et dans ce cas on aura un réseau assez dense de coupures, sur deux côtés entiers, et un morceau du troisième côté. Dans tous les cas, il nous faut maintenant deux feuilles distinctes, une pour représenter $k_{j_0}$ et l'autre pour représenter $-k_{j_0}$, et on passe de l'une à l'autre à chaque traversée de coupure. Notez que, nécessairement, si on se place assez près de $\infty$ sur les bords des triangles, un et un seul côté est une coupure. Ainsi, en faisant $T : \tau \mapsto \tau +1$, on en traverse toujours une. D'un autre côté, la transformation $S$ est une rotation d'angle $\pi$ autour de $i$, et pourvu que $j_0 \neq 1728$, on traversera forcément soit $0$ soit $2$ coupures. Enfin, si on fait le tour complet du point $\tau$ où $j$ vaut $j_0$, on traverse forcément une coupure. Appelons $M$ cette transformation[1. Ce $M$ est l'initiale du mot "monodromie". Une monodromie, c'est quand il se passe quelque chose de spécial quand on fait un tour complet autour d'un point. ]. On a donc le schéma suivant :
En plus des flèches vertes et rouges, il y a une nouvelle flèche, bleue, pour la transformation $M$. Si cette transformation provient d'une racine carrée, comme ici, on a forcément $M^2 = 1$, d'où la double flèche.
Nous avons donc construit ici une fonction modulaire avec monodromie. C'est un exemple rudimentaire, mais nous verrons dans la suite que l'on peut bâtir sur cet exemple des situations beaucoup plus riches. Pour terminer, voici à quoi ressemble le graphe de l'une des feuilles de $k_{j_0}$, pour $j_0 = 2 \times 1728 $ :
La prochaine fois, nous verrons en quoi ce type de manipulation peut servir de brique élémentaire à la construction de fonctions au propriétés de plus en plus surprenantes.
I have already said a few words about scattering amplitudes in a previous post, where I promised I would talk about the Cachazo-He-Yuan (CHY) formula. This formula was found in 2013, but just a few years before, a long standing "folklore theorem" had been understood in a new and deeper way. This will be the subject of this post, and hopefully next time we can deal with the CHY formula. So this folklore theorem I'm talking about is the title of this post, namely
Gravity = (Gauge theory)².
This curious relation is quite familiar for string theorists since the glorious days of perturbative string theory in the mid '80s. In 1986, Kawai, Lewellen and Tye derived at tree level a set of formulas expressing closed string amplitudes in terms of sums of products of open string amplitudes. In the low-energy limit, or equivalently the $\alpha ' \rightarrow 0$ limit, this gives a relation between gravity amplitudes and gauge theory amplitudes. More precisely, at tree level in field theory, graviton scattering must be expressible as a sum of products of well defined pieces of non-abelian gauge theory scattering amplitudes. For instance the four-graviton tree-level amplitude $M_4^{\textrm{tree}}$ and the four-gluon tree-level amplitude $A_4^{\textrm{tree}}$ are related by the KLT formula $$M_4^{\textrm{tree}}(1234) = (p_1 + p_2)^2 A_4^{\textrm{tree}} (1234)A_4^{\textrm{tree}}(1243). $$ There are also formulas for amplitudes with more gravitons or gluons, but they quickly become very intricate, and it is difficult to rephrase it nicely as "Gravity = (Gauge theory)²", as is the case for the four-point functions. And the exponents in the above formula are shouting at us that this is only a tree-level formula, which is then only of limited interest.
As we have just said, the KLT formula becomes more involved when the number of particles becomes bigger, and this is due to the sum over all orderings of colors in the Yang-Mills amplitude. Let us examine how such an amplitude can be decomposed. One key point is to rewrite all possible interactions (this means the $3$-point and the $4$-point interactions) in terms of just $3$-point interactions, introducing if necessary new virtual particles and adjusting the color factors in such a way that the final amplitude does not change.[1. Look at the references for more details about this crucial step. ] Then we can write $$A_n^{\textrm{tree}} = g^{n-2} \sum\limits_i \frac{n_i c_i}{\prod p_{\alpha_i}^2}$$ where the sum is over all the diagrams with cubic vertices that produce the amplitude, $g$ is the coupling constant, the $1/p_{\alpha_i}^2$ stand for the internal propagators, the $c_i$ are color factors (built out of the structure constants $f^{abc}$ of the gauge theory) and the $n_i$ are kinematic factors. Now if we consider functions $\Delta_i$ satisfying $$\sum\limits_i \frac{\Delta_i c_i}{\prod p_{\alpha_i}^2} = 0 , $$ then changing $n_i \rightarrow n_i + \Delta_i$ doesn't change the final amplitude. Such a transformation is called a generalized gauge transformation.
The Color-Kinematic duality and Gravity
In 2008, Bern, Carrasco and Johansson proposed the so-called color-kinematics duality. It says that there exists a generalized gauge transformation such that the $n_i$ have the same algebraic relations as the $c_i$, or more precisely $n_i+n_j = 0$ iff $c_i + c_j = 0$, and $n_i+n_j+n_k = 0$ iff $c_i + c_j +c_k= 0$. After this transformation is performed, gravity tree amplitudes are given by $$M_n^{\textrm{tree}} \sim \sum\limits_i \frac{n_i \tilde{n}_i}{\prod p_{\alpha_i}^2}. $$ Here the $\tilde{n}_i$ are the factors corresponding to another gauge theory. This is really an astounding statement: if one can find a gauge theory where the amplitudes are organized so that they satisfy the color-kinematic duality, then the gravity amplitudes are just obtained by replacing the color factors by kinematic factors of another gauge theory, which doesn't even have to satisfy the color-kinematic duality. The gravity theory whose amplitudes are thus computed is the theory whose spectrum corresponds to the product of the spectra of the two gauge theories. This is a very natural idea in perturbative string theory on the sphere (for the closed string) and on the disk (for the open string). For instance for $\mathcal{N}=8$ supergravity, the two gauge theories are $\mathcal{N}=4$ SYM.
So in this case, we see that our "theorem" is realized in a simpler way, and is valid for all $n$ and not just for $n=4$. However, the "tree" exponents are still annoying... But in 2010, the same authors conjectured that the relation remains true, with the necessary adaptations, between loop amplitudes! Roughly, gauge theory and gravity amplitudes are related via $$A_n^{\textrm{loop}} \sim \sum\limits_j \int \prod\limits_{l=1}^L \frac{d p_l}{(2\pi)^D} \frac{1}{S_j} \frac{n_i c_j}{\prod p_{\alpha_i}^2}$$ and $$M_n^{\textrm{loop}} \sim \sum\limits_j \int \prod\limits_{l=1}^L \frac{d p_l}{(2\pi)^D} \frac{1}{S_j} \frac{n_i \tilde{n}_j}{\prod p_{\alpha_i}^2} .$$ Here $L$ is the number of loops, and the $S_j$ are the internal symmetry factors of the diagrams. The other notations should be self-evident.
This conjecture, inspired from ideas based on unitarity, has been tested in several non-trivial examples. As is clear on the expressions above, it gives a satisfactory precise statement for our would-be theorem. Moreover, it makes it simpler to compute several supergravity amplitudes. More details can be found in the book by Henriette Elvang, Yu-tin Huang, available on the arXiv.
Holography in flat space
As a final comment, let us point out that there is another well-known relation between gravity and gauge theory, through holography, in the $AdS/CFT$ correspondence. In this case, it seems that one gauge theory is equivalent to a gravitational theory. However, the fact that the gravitational space-time is $AdS$ implies that there is no possible gravitational $S$-matrix, and equivalently in a CFT there are no asymptotic states, and therefore no amplitudes. In fact, the subject of this note can be seen as holography in flat space. Indeed, we learn deep information, both at tree-level and at the multi-loop level, just from boundary data, ie the kinematics data of the particle that come from infinity and go back to infinity. One can roughly remember the slogan :
S-matrix = Holography in flat space.
I thank Miguel Angel Vázquez-Mozo, Diego Rodriguez-Gomez and Carlos Hoyos for useful conversations on this topic.
subscribe via RSS