Exploring the Czech-Slovak Olympiad problem.

Our goal is to explore the solution of Achal Kumar. Specifically, we will start with all axioms and the constants $m$ and $n$ and then look for lemmas. Recall the problem:

Let ⋆ be a binary operation on a nonempty set $M$. That is, every pair $(a,b) \in M$ is assigned an element $a$ ⋆$ b$ in $M$. Suppose that ⋆ has the additional property that $(a $ ⋆ $b) $ ⋆$ b= a$ and $a$ ⋆ $(a$ ⋆$ b)= b$ for all $a,b \in M$. Show that $a$ ⋆ $b = b$ ⋆ $a$ for all $a,b \in M$.

We should derive the following lemmas.

$ m = (m*n)*n $
$ n = (m*n)*((m*n)*n) $
$ (m*n)*m = (m*n)*((m*n)*n) $
$ ((m*n)*m))*m = m*n $
$ (m*n)*m = n $
$ ((m*n)*m)*m = n*m $

Finally, we should get the desired result.

$ m*n = n*m $



In [1]:

    
import $cp.bin.`provingground-core-jvm-6b59061b0d.fat.jar`
import provingground._ , interface._, HoTT._, learning._ 
repl.pprinter() = {
  val p = repl.pprinter()
  p.copy(
    additionalHandlers = p.additionalHandlers.orElse {
      translation.FansiShow.fansiHandler
    }
  )
}









    Out[1]:





import $cp.$                                              

import provingground._ , interface._, HoTT._, learning._



In [2]:

    
val M = "M" :: Type

val eqM = "eqM" :: M ->: M ->: Type

val a = "a" :: M
val b = "b" :: M
val c = "c" :: M

val m = "m" :: M

val n = "n" :: M

val mul = "mul" :: M ->: M ->: M

import FineDeducer.unif









    Out[2]:





M: Typ[Term] = M
eqM: Func[Term, Func[Term, Typ[Term]]] = eqM
a: Term = a
b: Term = b
c: Term = c
m: Term = m
n: Term = n
mul: Func[Term, Func[Term, Term]] = mul
import FineDeducer.unif



In [3]:

    
val Thm = eqM(mul(m)(n))(mul(n)(m))

val Lemma1 = eqM(m)(mul(mul(m)(n))(n))
val Lemma2 = eqM(n)(mul(mul(m)(n))(mul(mul(m)(n))(n)))
val Lemma3 = eqM(mul(mul(m)(n))(m))(mul(mul(m)(n))(mul(mul(m)(n))(n)))
val Lemma4 = eqM(mul(mul(mul(m)(n))(m))(m))(mul(m)(n))
val Lemma5 = eqM(mul(mul(m)(n))(m))(n)
val Lemma6 = eqM(mul(mul(mul(m)(n))(m))(m))(mul(n)(m))









    Out[3]:





Thm: Typ[Term] = eqM(mul(m)(n))(mul(n)(m))
Lemma1: Typ[Term] = eqM(m)(mul(mul(m)(n))(n))
Lemma2: Typ[Term] = eqM(n)(mul(mul(m)(n))(mul(mul(m)(n))(n)))
Lemma3: Typ[Term] = eqM(mul(mul(m)(n))(m))(mul(mul(m)(n))(mul(mul(m)(n))(n)))
Lemma4: Typ[Term] = eqM(mul(mul(mul(m)(n))(m))(m))(mul(m)(n))
Lemma5: Typ[Term] = eqM(mul(mul(m)(n))(m))(n)
Lemma6: Typ[Term] = eqM(mul(mul(mul(m)(n))(m))(m))(mul(n)(m))

Note that the above are defined just by using copy-paste (this is why we changed op to mul). We set up a local prover with all the axioms we use.



In [4]:

    
val fullTerms : FiniteDistribution[Term] = (unif(a,b,c)(m,n, mul, eqM)(
    eqM(a)(a),
    eqM(a)(b) ->: eqM(b)(a),
    eqM(a)(b) ->: eqM(b)(c) ->: eqM(a)(c),
    eqM(mul(mul(a)(b))(b))(a),
    eqM(mul(a)(mul(a)(b)))(b),
    eqM(b)(c) ->: eqM(mul(b)(a))(mul(c)(a))
  ) * 0.5 ++ (FiniteDistribution.unif(eqM: Term) * 0.125) ++ (FiniteDistribution.unif(mul : Term ) * 0.375)).filter((t) => !Set(a, b, c).contains(t)).normalized()









    Out[4]:





fullTerms: FiniteDistribution[Term] = FiniteDistribution(
  Vector(
    Weighted(m, 0.04347826086956522),
    Weighted(n, 0.04347826086956522),
    Weighted(mul, 0.04347826086956522),
    Weighted(eqM, 0.04347826086956522),
    Weighted(axiom_{eqM(a)(a)}, 0.04347826086956522),
    Weighted(axiom_{(eqM(a)(b) \to eqM(b)(a))}, 0.04347826086956522),
    Weighted(
      axiom_{(eqM(a)(b) \to (eqM(b)(c) \to eqM(a)(c)))},
      0.04347826086956522
    ),
    Weighted(axiom_{eqM(mul(mul(a)(b))(b))(a)}, 0.04347826086956522),
    Weighted(axiom_{eqM(mul(a)(mul(a)(b)))(b)}, 0.04347826086956522),
    Weighted(
      axiom_{(eqM(b)(c) \to eqM(mul(b)(a))(mul(c)(a)))},
      0.04347826086956522
    ),
    Weighted(eqM, 0.14130434782608697),
    Weighted(mul, 0.4239130434782609)
  )
)



In [5]:

    
import monix.execution.Scheduler.Implicits.global
val ts = TermState(fullTerms,fullTerms.map(_.typ))
val lp0 = LocalProver(ts).addGoals(Lemma1 -> 0.1, Lemma2 -> 0.1, Lemma3 -> 0.1, Lemma4 -> 0.1, Lemma5 -> 0.1, Lemma6 -> 0.1, Thm -> 0.4).noIsles
def lp(n: Int) = lp0.sharpen(math.pow(2, n))









    Out[5]:





import monix.execution.Scheduler.Implicits.global

ts: TermState = TermState(
  FiniteDistribution(
    Vector(
      Weighted(m, 0.04347826086956522),
      Weighted(n, 0.04347826086956522),
      Weighted(mul, 0.04347826086956522),
      Weighted(eqM, 0.04347826086956522),
      Weighted(axiom_{eqM(a)(a)}, 0.04347826086956522),
      Weighted(axiom_{(eqM(a)(b) \to eqM(b)(a))}, 0.04347826086956522),
      Weighted(
        axiom_{(eqM(a)(b) \to (eqM(b)(c) \to eqM(a)(c)))},
        0.04347826086956522
      ),
      Weighted(axiom_{eqM(mul(mul(a)(b))(b))(a)}, 0.04347826086956522),
      Weighted(axiom_{eqM(mul(a)(mul(a)(b)))(b)}, 0.04347826086956522),
      Weighted(
        axiom_{(eqM(b)(c) \to eqM(mul(b)(a))(mul(c)(a)))},
        0.04347826086956522
      ),
      Weighted(eqM, 0.14130434782608697),
      Weighted(mul, 0.4239130434782609)
    )
  ),
  FiniteDistribution(
    Vector(
      Weighted(M, 0.04347826086956522),
      Weighted(M, 0.04347826086956522),
      Weighted((M → (M → M)), 0.04347826086956522),
      Weighted((M → (M → 𝒰 )), 0.04347826086956522),
      Weighted(∏(a : M){ eqM(a)(a) }, 0.04347826086956522),
      Weighted(
        ∏(a : M){ ∏(b : M){ (eqM(a)(b) → eqM(b)(a)) } },
        0.04347826086956522
      ),
      Weighted(
        ∏(a : M){ ∏(b : M){ ∏(c : M){ (eqM(a)(b) → (eqM(b)(c) → eqM(a)(c))) } } },
        0.04347826086956522
      ),
...
lp0: LocalProver = LocalProver(
  TermState(
    FiniteDistribution(
      Vector(
        Weighted(m, 0.04347826086956522),
        Weighted(n, 0.04347826086956522),
        Weighted(mul, 0.04347826086956522),
        Weighted(eqM, 0.04347826086956522),
        Weighted(axiom_{eqM(a)(a)}, 0.04347826086956522),
        Weighted(axiom_{(eqM(a)(b) \to eqM(b)(a))}, 0.04347826086956522),
        Weighted(
          axiom_{(eqM(a)(b) \to (eqM(b)(c) \to eqM(a)(c)))},
          0.04347826086956522
        ),
        Weighted(axiom_{eqM(mul(mul(a)(b))(b))(a)}, 0.04347826086956522),
        Weighted(axiom_{eqM(mul(a)(mul(a)(b)))(b)}, 0.04347826086956522),
        Weighted(
          axiom_{(eqM(b)(c) \to eqM(mul(b)(a))(mul(c)(a)))},
          0.04347826086956522
        ),
        Weighted(eqM, 0.14130434782608697),
        Weighted(mul, 0.4239130434782609)
      )
    ),
    FiniteDistribution(
      Vector(
        Weighted(M, 0.04347826086956522),
        Weighted(M, 0.04347826086956522),
        Weighted((M → (M → M)), 0.04347826086956522),
        Weighted((M → (M → 𝒰 )), 0.04347826086956522),
        Weighted(∏(a : M){ eqM(a)(a) }, 0.04347826086956522),
        Weighted(
          ∏(a : M){ ∏(b : M){ (eqM(a)(b) → eqM(b)(a)) } },
          0.04347826086956522
        ),
        Weighted(
          ∏(a : M){ ∏(b : M){ ∏(c : M){ (eqM(a)(b) → (eqM(b)(c) → eqM(a)(c))) } } },
          0.04347826086956522
...
defined function lp



In [6]:

    
def nslp(n: Int) = {
    val lpc = lp(n)
     lpc.nextState.map{ns => (n, ns, lpc)}
}
val bT = Utils.bestTask((1 to 30).map(nslp)).memoize









    Out[6]:





defined function nslp
bT: monix.eval.Task[Option[(Int, TermState, LocalProverStep)]] = Async(
  <function2>,
  false,
  true,
  true
)

We have set up a task that refines up to timeout. We will run this asynchronously, and then use the final state.



In [7]:

    
import monix.execution.Scheduler.Implicits.global
val bF = bT.runToFuture









    





import monix.execution.Scheduler.Implicits.global

bF: monix.execution.CancelableFuture[Option[(Int, TermState, LocalProverStep)]] = Success(
  Some(
    (
      5,
      TermState(
        FiniteDistribution(
          Vector(
            Weighted(
              axiom_{(eqM(b)(c) \to eqM(mul(b)(a))(mul(c)(a)))}(n)(mul(n)(n))(mul(n)(m)),
              2.324354456130709E-6
            ),
            Weighted(
              axiom_{eqM(mul(a)(mul(a)(b)))(b)}(m)(mul(n)(m)),
              6.347281393521325E-5
            ),
            Weighted(
              axiom_{(eqM(a)(b) \to eqM(b)(a))}(m)(mul(m)(n)),
              6.347281393521325E-5
            ),
            Weighted(eqM(mul(n)(mul(n)(n))), 9.230935259082332E-4),
            Weighted(
              axiom_{(eqM(a)(b) \to eqM(b)(a))}(mul(m)(m))(mul(n)(mul(m)(m))),
              9.442568778789472E-6
            ),
            Weighted(
              axiom_{(eqM(b)(c) \to eqM(mul(b)(a))(mul(c)(a)))}(m)(mul(m)(m))(mul(n)(mul(m)(n))),
              9.263575132330986E-7
            ),
            Weighted(
              axiom_{(eqM(a)(b) \to eqM(b)(a))}(mul(m)(mul(n)(m))),
              2.171984766842902E-4
            ),
            Weighted(
              axiom_{(eqM(b)(c) \to eqM(mul(b)(a))(mul(c)(a)))}(m)(mul(m)(n))(mul(m)(n)),
              2.324354456130709E-6
            ),
...



In [8]:

    
val ax = fullTerms.support.find(_.typ == a ~>: (b~>: eqM(mul(mul(a)(b))(b))(a))).get









    Out[8]:





ax: Term = axiom_{eqM(mul(mul(a)(b))(b))(a)}



In [9]:

    
val l = fold(ax)(m, n)









    Out[9]:





l: Term = axiom_{eqM(mul(mul(a)(b))(b))(a)}(m)(n)

We should look for the above instantiation at least.



In [10]:

    
val nsT = bT.map(_.get._2).memoize
val lpT = bT.map(_.get._3).memoize









    Out[10]:





nsT: monix.eval.Task[TermState] = Async(<function2>, false, true, true)
lpT: monix.eval.Task[LocalProverStep] = Async(<function2>, false, true, true)



In [11]:

    
val lwT = nsT.map(_.terms(l))









    Out[11]:





lwT: monix.eval.Task[Double] = Map(
  Async(<function2>, false, true, true),
  ammonite.$sess.cmd10$Helper$$Lambda$2909/222344919@24914606,
  0
)



In [13]:

    
bF.value









    Out[13]:





res12: Option[scala.util.Try[Option[(Int, TermState, LocalProverStep)]]] = None



In [14]:

    
nsT.map(_.successes).runToFuture









    





res13: monix.execution.CancelableFuture[Vector[(Typ[Term], Double, FiniteDistribution[Term])]] = Success(
  Vector(
    (
      eqM(m)(mul(mul(m)(n))(n)),
      0.1,
      FiniteDistribution(
        Vector(
          Weighted(
            axiom_{(eqM(a)(b) \to eqM(b)(a))}(mul(mul(m)(n))(n))(m)(axiom_{eqM(mul(mul(a)(b))(b))(a)}(m)(n)),
            1.6566696424871182E-5
          )
        )
      )
    ),
    (
      eqM(mul(mul(mul(m)(n))(m))(m))(mul(m)(n)),
      0.1,
      FiniteDistribution(
        Vector(
          Weighted(
            axiom_{eqM(mul(mul(a)(b))(b))(a)}(mul(m)(n))(m),
            8.743805478183067E-5
          )
        )
      )
    )
  )
)

First result

We see that two of the lemmas have been proved:

$m = (m * n) * n$ (Lemma 1)
$((m * n) * m) * m = m * n$ (Lemma 4)

Both these are simple instantiations, but they get us started. The basic statement missing in Lemma 2. We should look at all the generated lemmas.



In [15]:

    
val lemmaT = lpT.flatMap(_.lemmas).memoize









    Out[15]:





lemmaT: monix.eval.Task[Vector[(Typ[Term], Double)]] = Async(
  <function2>,
  false,
  true,
  true
)



In [16]:

    
lemmaT.runToFuture









    





res15: monix.execution.CancelableFuture[Vector[(Typ[Term], Double)]] = Success(
  Vector(
    (eqM(m)(mul(mul(m)(n))(n)), 0.04427272562096321),
    (eqM(mul(mul(mul(m)(n))(m))(m))(mul(m)(n)), 0.044028746260243),
    (eqM(n)(mul(m)(mul(m)(n))), 1.593189627146002E-4),
    (eqM(n)(mul(n)(mul(n)(n))), 1.593189627146002E-4),
    (eqM(m)(mul(n)(mul(n)(m))), 1.593189627146002E-4),
    (eqM(m)(mul(m)(mul(m)(m))), 1.593189627146002E-4),
    (eqM(m)(m), 1.6403707024362324E-5),
    (eqM(n)(n), 1.6403707024362324E-5),
    (eqM(mul(n)(n))(mul(n)(n)), 1.27446392202884E-5),
    (eqM(mul(m)(m))(mul(m)(m)), 1.27446392202884E-5),
    (eqM(mul(m)(n))(mul(m)(n)), 1.27446392202884E-5),
    (eqM(mul(n)(m))(mul(n)(m)), 1.27446392202884E-5),
    (eqM(mul(m)(mul(m)(n)))(n), 1.111012978591498E-5),
    (eqM(mul(n)(mul(n)(n)))(n), 1.111012978591498E-5),
    (eqM(mul(m)(mul(m)(m)))(m), 1.111012978591498E-5),
    (eqM(mul(n)(mul(n)(m)))(m), 1.111012978591498E-5)
  )
)



In [17]:

    
val l1 = "assume" :: Lemma1
val lptT = lpT.flatMap(_.tangentProver(l1).map(_.copy(cutoff = math.pow(10, -4))))









    Out[17]:





l1: Term = assume
lptT: monix.eval.Task[LocalTangentProver] = FlatMap(
  Async(<function2>, false, true, true),
  ammonite.$sess.cmd16$Helper$$Lambda$3220/1409465144@24a4258e
)



In [18]:

    
val s1T = lptT.flatMap(_.successes)









    Out[18]:





s1T: monix.eval.Task[Vector[(Typ[Term], Double, FiniteDistribution[Term])]] = FlatMap(
  FlatMap(
    Async(<function2>, false, true, true),
    ammonite.$sess.cmd16$Helper$$Lambda$3220/1409465144@24a4258e
  ),
  ammonite.$sess.cmd17$Helper$$Lambda$3226/1148167069@2b790ee
)



In [19]:

    
val s1F = s1T.runToFuture









    





s1F: monix.execution.CancelableFuture[Vector[(Typ[Term], Double, FiniteDistribution[Term])]] = Success(
  Vector(
    (
      eqM(m)(mul(mul(m)(n))(n)),
      0.1,
      FiniteDistribution(
        Vector(
          Weighted(
            axiom_{(eqM(a)(b) \to eqM(b)(a))}(mul(mul(m)(n))(n))(m)(axiom_{(eqM(a)(b) \to eqM(b)(a))}(m)(mul(mul(m)(n))(n))(assume)),
            1.5642102750722928E-4
          ),
          Weighted(
            axiom_{(eqM(a)(b) \to eqM(b)(a))}(mul(mul(m)(n))(n))(m)(axiom_{eqM(mul(mul(a)(b))(b))(a)}(m)(n)),
            0.003627760252365932
          ),
          Weighted(assume, 0.32499999999999996),
          Weighted(
            axiom_{(eqM(a)(b) \to eqM(b)(a))}(mul(mul(m)(n))(n))(m)(axiom_{eqM(mul(mul(a)(b))(b))(a)}(m)(n)),
            8.283348212435586E-6
          )
        )
      )
    ),
    (
      eqM(mul(mul(mul(m)(n))(m))(m))(mul(m)(n)),
      0.1,
      FiniteDistribution(
        Vector(
          Weighted(
            axiom_{eqM(mul(mul(a)(b))(b))(a)}(mul(m)(n))(m),
            0.003627760252365932
          ),
          Weighted(
            axiom_{eqM(mul(mul(a)(b))(b))(a)}(mul(m)(n))(m),
            4.371902739091531E-5
          )
...



In [20]:

    
s1F.map(v => v.map(_._1))









    





res19: monix.execution.CancelableFuture[Vector[Typ[Term]]] = Success(
  Vector(eqM(m)(mul(mul(m)(n))(n)), eqM(mul(mul(mul(m)(n))(m))(m))(mul(m)(n)))
)

This tangent did not give additional conclusions.

Final remarks: Enough stuff was not generated even after the corrections. We should redo this using only applications and unified applications.